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内 容 简 介 


本 书 以 统计 学 基本 步骤 为 主线 ， 从 最 为 基础 的 收集 和 整理 数据 开始 ， 渐 次 介绍 数据 分 析 的 两 种 方法 : 
描述 性 统计 分 析 和 推断 性 统计 分 析 。 对 变量 的 分 析 也 由 研究 单一 变量 间 的 关系 逐步 过 渡 到 对 二 维 变量 及 多 
元 变量 的 分 析 ， 其 间 适 时 配 以 案例 。 考 虑 到 学 生 的 向 量 代数 的 基础 ， 回 归 分 析 中 主要 是 以 单个 方程 为 主 。 

本 书 共 分 8 章 ， 具 体内 容 包 括 : 总 论 、 统 计数 据 的 收集 与 处 理 、 统 计数 据 的 整理 与 图 形 展示 、 统 计数 
据 的 指标 度量 、 参 数 估计 、 假 设 检验 、 方 差分 析 、 相 关 与 一 元 回归 分 析 。 

本 书 既 可 作为 高 等 院 校 财经 管理 类 专业 的 本 、 专 科 生 教材 ， 也 可 作为 相关 工作 人 员 自 学 参考 用 书 。 
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我 国 越 来 越 多 的 高 等 院 校 设置 了 经 济 管理 类 学 科 专业 ， 这 是 一 个 包括 理论 经 济 学 、 应 
经 济 学 、 管 理科 学 与 工程 、 工 商 管理 、 公 共管 理 、 农 林 经 济 管理 、 图 书馆 、 情 报 与 档案 
管理 7 个 一 级 学 科 门 类 和 31 个 专业 的 庞大 学 科 体系 。2006 年 教育 部 的 数据 表明 ， 在 全 国 
普通 高 校 中 ， 经 济 类 专业 布点 1518 个 ， 管 理 类 专业 布点 4328 个 。 其 中 除 少量 院 校 设置 的 
经 济 管理 专业 偏重 理论 教学 外 ， 绝 大 部 分 属于 应 用 型 专业 。 经 济 管理 类 应 用 型 专业 主要 着 
R 于 培养 社会 主义 国民 经 济 发 展 所 需要 的 德 智 体 全 面 发 展 的 高 素质 专 [] 人才， 要 求 既 具有 
KRASNER REMENE, XASRENREEE K 又 要 求 具有 较 好 的 
创新 精神 和 实践 能 力 。 N 

在 当前 开拓 新 型 工业 化 道路 ， 推 进 全 面 小 康 社会 ds 
T a, Wm (t Weremmipin a, Raimi 
专业 理论 素质 和 应 th 广 高 素质 的 经 济 管理 人 才 ， 越 来 越 成 









































































































































为 提升 我 国 经 济 竞争 力 、 保证 国民 经 济 持续 康 发 展 的 重要 前 提 。 这 就 要 求 高 等 财经 教育 
要 更 加 注重 依据 国 “woa S 时 变革 和 调整 教育 目标 和 教学 内 容 ， 要 求 
经 济 管理 学 科 专 业 更 加 注重 应 用 、 注 3 、 注 重 规范 、 注 重 国际 交流 ， 要 求 经 济 管理 学 
科 专 业 与 其 他 学 科 专 业 相互 交融 与 MRE: 要 求 高 等 财经 教育 培养 的 人 才 具 有 更 加 丰富 
的 社会 知识 和 较 强 的 人 文 素质 及 创新 精神 。 要 完成 上 述 任务 5 各 所 高 等 院 校 需要 进行 深入 


























的 教学 改革 和 创新 特别 是 要 销 好 有 较 高 质量 的 教材 的 编写 和 创新 工作 。 

e A X 2995 a 学 科教 材 实际 情况 的 调研 ， 在 与 众多 专 
家 学 者 讨论 的 基础 上 =， 决定 编写 和 出 版 了 大 面 向 经 济 管理 学 科 专 业 的 应 用 型 系列 教材 ， 这 
" 55 要 措施 。 

本 系列 款 科 是 按照 高 等 学 校 经 济 类 和 管理 类 学 科 本 科 专 业 规范 、 培 养 方案 ， 以 及 课程 
教学 大 纲 的 要 求 ， 合 理 定位 ， 由 长 期 在 教学 第 一 线 从 事 教学 工作 的 教师 编写 ,立足 于 21 世 
纪 经 济 管理 类 学 科 发 展 的 需要 ， 深 入 分 析 经 济 管理 类 专业 本 科学 生 现 状 及 存在 的 问题 ， 探 
索 经 济 管理 类 专业 本 科学 生 综合 素质 培养 的 途径 ， 以 科学 性 、 先 进 性 、 系 统 性 和 实用 性 为 
目标 ， 其 编写 的 特色 主要 体现 在 以 下 几 个 方面 : 

(1) 关注 经 济 管理 学 科 发 展 的 大 背景 ， 拓 宽 理 论 基础 和 专业 知识 ， 着 眼 于 增强 教学 内 
容 与 实际 的 联系 和 应 用 性 ， 突 出 创造 能 力 和 创新 意识 。 

D 体系 完整 、 严 密 。 系 列 涵盖 经 济 类 、 管 理 类 相关 专业 以 及 与 经 管 相关 的 部 分 法 律 
类 课程 ， 并 把 握 相关 课程 之 间 的 关系 ， 整 个 系列 从 书 形成 一 套 完整 、 严 密 的 知识 结构 体系 。 

(3) 内 容 新 颖 。 借 鉴 国外 最 新 的 教材 ， 融 会 当前 有 关 经 济 管理 学 科 的 最 新 理论 和 实践 
经 验 ， 用 最 新 知识 充实 教材 内 容 。 

(4) 合作 交流 的 成 果 。 本 系列 教材 是 由 全 国 上 百 所 高 校 教师 共同 编写 而 成 ， 在 相互 进 
行 学 术 交 流 、 经 验 借鉴 取长补短、 集思广益 的 基础 上 ， 形 成 编写 大 纲 。 最 终 融 合 了 各 地 
特点 ， 有 具有 较 强 的 适应 性 。 
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(5) 案例 教学 。 教 材 融 入 了 大 量 案例 研究 分 析 内 容 ， 让 学 生 在 学 习 过 程 中 理论 联系 实 
际 , 特别 列举 了 我 国 经 济 管理 工作 中 的 大 量 实际 案例 , 这 可 大 大 增强 学 生 的 实际 操作 能 力 。 

(6) 注重 能 力 培养 。 力 求 做 到 不 断 强化 自我 学 习 能 力 、 思 维 能 力 、 创 造 性 解决 问题 的 
能 力 以 及 不 断 自我 更 新 知识 的 能 力 ， 促 进 学 生 向 着 富有 鲜明 个 性 的 方向 发 展 。 

作为 高 要 求 ， 经 济 管理 类 教材 应 在 基本 理论 上 做 到 以 马克 思 主 义 为 指导 ， 结 合 我 国 财 
经 工作 的 新 实践 ， 充 分 汲取 中 华 民 族 优秀 文化 和 西方 科学 管理 思想 ， 形 成 具有 中 国 特色 的 
创新 教材 。 这 一 目标 不 可 能 一 跷 而 就 ， 需 要 作者 通过 长 期 艰苦 的 学 术 劳 动 和 不 断 地 进行 教 
材 内 容 的 更 新 才能 达成 。 我 希望 这 一 系列 教材 的 编写 ， 将 是 我 国 拥有 较 高 质量 的 高 校 财 经 
管理 学 科 应 用 型 教材 建设 工程 的 新 尝试 和 新 起 点 。 

我 要 感谢 参加 本 系列 教材 编写 和 审 稿 的 各 位 老师 所 付出 的 大 Ce 
由 于 编写 时 间 紧 、 相 互 协调 难度 大 等 原因 ， sess i — ta 和 错漏 。 我 相 








































































































售 ， 在 各 位 老师 的 关心 和 帮助 下 ， 本 系列 教材 一 定 能 省 完善 ， 并 在 我 国 大 学 经 
itt ninapak 促进 作用 。 
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1.2.2 理论 统计 学 和 应 用 统计 学 
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l. 掌握 统计 学 的 含义 及 研究 对 象 ， INN Š. 
2， 掌 握 统计 学 的 分 类 。 AN 
3. 掌握 统计 数据 的 类 型 。 FAN 
4. 掌握 统计 学 中 的 几 个 基本 概念 。 NAN ` 
aX S 
4 K 统计 学 概述 I 


Bisa, AE y Ay gt” iz- 本 
看 见 一 些 资料 使 用 统计 数据 < 图表 等 形式 。 本 章 将 详细 讲解 统计 学 的 基本 原理 ， 包 括 统计 
及 统计 学 的 信义 统计 学 研究 的 对 象 及 特 ， il wisnu. 统计 学 的 分 类 、 统 计数 
所 的 类型 及 统计 入/L 个 基本 的 概 合 。 y 


LLI ats 的 含义 P 


统计 指 对 某 一 现象 有 关 数 据 的 收集 、 整 理 、 计 算 和 分 析 等 的 活动 。 在 统计 的 应 用 中 ， 
人 们 对 “统计 ”一 词 的 理解 一 般 有 3 种 含义 : 统计 工作 、 统 计 资料 和 统计 学 。 

定义 1.1 统计 工作 是 指 利 用 科学 的 方法 收集 资料 、 整 理 资料 、 分 析 资 料 和 提供 关于 社 
会 经 济 现象 数量 关系 的 工作 总 称 。 

统计 工作 是 统计 资料 和 统计 学 的 基础 。 

定义 1.2 统计 资料 是 指 通过 上 面 所 说 的 统计 工作 取得 的 \ 用 来 反映 社会 经 济 现象 的 数 
据 资料 总 称 。 

统计 工作 的 成 果 是 统计 资料 ， 统 计 工 作 所 取得 的 各 项 数字 资料 及 有 关 文 字 资 料 ， 通 常 
反映 在 统计 表 、 统 计 图 、 统 计 手 册 、 统 计 年 鉴 、 统 计 资 料 汇编 和 统计 分 析 报 告 中 。 

定义 1.3 统计 学 是 指 研究 如 何 收集 数据 、 如 何 整理 数据 、 如 何 分 析 数 据 和 最 后 解释 数 
据 ， 并 从 数据 中 得 出 规律 的 一 门 科学 。 
统计 学 既是 统计 工作 经 验 的 理论 概括 ， 又 是 指导 统计 工作 的 原理 、 原 则 和 方法 。 
统计 工作 、 统 计 资料 、 统 计 学 三 者 之 间 的 关系 : 利用 统计 学 的 理论 ， 指 导 统计 工作 ， 
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最 后 得 出 统计 资料 。 其 中 统计 学 是 关于 数据 的 科学 ， 它 提供 了 有 关 数据 收集 、 数 据 处 理 、 
数据 分 析 、 数 据 解释 并 从 数据 中 得 出 结论 的 方法 。 
1.1.2 ”统计 学 研究 的 对 象 及 特点 

1， 统 计 学 研究 的 对 象 

统计 学 研究 的 内 容 是 数据 ， 而 数据 是 社会 经 济 现象 的 数量 特征 和 数量 关系 的 表现 ， 从 
数据 中 找 出 经 济 规律 性 。 因 此 ， 统 计 学 的 研究 对 象 为 大 量 社会 经 济 现象 的 数量 特征 和 数量 
关系 ， 以 揭示 其 规律 性 。 

2， 统 计 学 研究 对 象 的 特点 š 

1) 总 体 性 入 

一 般 情况 下 ， tr 总 体 的 数量 特征 ， 研 究 
的 方法 是 利用 样本 的 信息 推导 出 总 体 的 数量 特征 。 
例如 ， 要 研究 某 地 区 居民 的 收入 水 平 ， 目 的 不 在 别 居民 的 收入 状况 ， 而 是 要 
通过 对 很 多 个 别 居民 收入 状况 的 了 解 ， 达 到 对 全 NT 再 如 ， 某 企 
业 对 其 生产 的 一 批 日 光 灯 管 的 平均 使 用 寿命 ， 不 可 能 把 这 批 日 光 灯 管 全 部 点 亮 来 
研究 其 平均 寿命 ， 因 为 该 种 研究 属于 Wi -组 样本 
o a RERE nman 
2) 数量 性 
统计 学 研究 对 象 的 数量 性 kq 
ss manan g, 研究 现象 间 的 数量 关系 和 
TAARIA. MNARA [指标 和 指标 体系 来 反映 研究 对 象 总 体 
的 规模 、 水 平 、 速 度 、 比 例 、 se Aa 
例如 ,* 我 国 的 从 口 数量 构成 及 其 发 结构 的 构成 及 发 展 趋势 、 国 民生 产 总 
b ans pe et st e a A te 
业 利润 。 
1.1.3 ”统计 学 的 应 用 领域 


统计 学 的 研究 内 容 为 数据 ， 只 要 有 数据 的 存在 就 会 用 到 统计 学 。 随 着 定量 研究 重要 性 
的 提高 ， 现 代 统计 学 的 应 用 日 益 广泛 ， 理 、 工 、 农 、 医 、 文 、 经 ， 都 要 用 到 统计 学 的 。 例 
如 ， 政 府 部 门 利 用 统计 学 进行 宏观 调控 和 管理 ;日 常生 活 中 ， 统 计 学 是 企业 管理 与 决策 的 
依据 等 。 下 面 主要 介绍 统计 学 在 经 济 管理 中 的 一 些 应 用 。 

1. 企业 开发 新 产品 

企业 为 了 在 激烈 的 市 场 竞争 中 求 得 平稳 的 发 展 ， 必 然 要 根据 市 场 的 变化 在 适当 的 时 候 
引入 新 产品 。 引 入 新 产品 前 ， 企 业 要 对 新 产品 进行 市 场 定位 ， 包 括 市 场 分 析 、 对 新 产品 的 
价格 进行 市 场 定 位 、 对 消费 群体 进行 定位 等 ， 只 有 全 面 分 析 ， 新 产品 开发 才能 获胜 。 同 时 ， 
新 产品 进入 市 场 后 ， 企 业 要 不 断 进 行 产 品 跟踪 调查 ， 不 断 完善 新 产品 。 而 这 些 离 不 开 统计 
学 ， 它 们 需要 统计 学 提供 可 靠 的 数据 ， 对 数据 进行 分 析 ， 得 出 决策 的 信息 。 
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总 wals 

2. MAANA 

上 市 公司 的 财务 报表 中 的 数据 是 投资 者 进行 决策 的 重要 参考 依据 。 投 资 者 分 析 上 市 公 
司 的 财务 报表 数据 的 定量 关系 ， 最 后 进行 决策 。 企 业 自 身 的 投资 也 离 不 开 财 务 数据 的 分 析 。 

3， 竞 争 对 手 的 研究 

随 着 社会 经 济 的 发 展 ， 各 个 行业 内 部 之 间 的 竞争 也 日 益 加 剧 。 企 业 要 想 取得 优势 ， 抢 
占 时 机 ， 就 要 不 断 地 了 解 竞争 对 手 ， 摸 清 对 手 的 竞争 策略 ， 发 现 其 弱势 ， 利 用 自己 的 优势， 
制定 获胜 的 策略 ， 而 做 这 些 的 前 提 是 要 进行 数据 分 析 。 


12 统计 学 的 分 类 。 
































1.2.1 “描述 统计 学 和 推断 统计 学 
， 描 述 统计 学 和 推断 统计 学 的 定义 2. N 


统计 学 按照 统计 数据 分 析 的 方法 不 同 ， NORA AEN. 

定义 1.4 “描述 统计 是 指 研究 数据 收集 :| 处 理 数据 和 描述 数据 的 统计 学 分 支 。 

描述 统计 学 的 内 容 包括 如 何 取得 要 研究 的 数据 、 用 什么 样 的 图 表 对 数据 进行 处 理 和 显 
示 ， 进 而 通过 综合 、 概 括 与 分 析 ， 得 出 及 映 所 研究 现象 的 一 般 性 特征 。 

winaspa” NRE AD 条 形 图 即 属于 描述 统计 学 ， 
其 统计 学 成 绩 数据 见 表 -所 


N 








I < 表 1-1 te 
成 绩 结果 X. | r 


N P 优秀 NK rl 
N 良好 15 
中 等 16 
及 格 14 
不 及 格 E 
合计 55 








该 组 数据 采用 条 形 图 来 描述 ， 利 用 Excel 软件 来 绘制 ， 绘 制 结果 如 图 1.1 所 示 。 

定义 1.5 “推断 统计 学 是 指 通过 研究 如 何 根据 统计 样本 的 资料 计算 样本 的 特征 信息 ,来 
推断 总 体 相关 的 特征 的 方法 。 

例如 ， 从 一 个 果园 中 采摘 40 个 橘子 ， 利 用 这 40 个 橘子 的 平均 重量 来 估计 整个 果园 所 
有 橘子 的 平均 重量 。 

2. 描述 统计 学 与 推断 统计 学 的 关系 

一 般 来 讲 ， 描 述 统计 学 是 现代 统计 学 的 前 期 工作 ， 是 推断 统计 学 的 基础 ， 推 断 统计 学 
是 现代 统计 学 的 核心 ,是 描述 统计 学 的 发 展 . 这 两 部 分 是 统计 学 的 两 个 不 可 缺 的 组 成 内 容 。 
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统计 学 人) messa — í 











优秀 良好 << 及 格 
图 1.1 统计 学 成 绩 条 形 图 


例如 ， 想 研究 某 城市 居民 的 消费 水 平 ， 而 往往 ; = 所 有 居民 消费 水 平 的 数据 是 
很 难 收集 的 ， 这 时 ， 需 要 对 这 个 城市 的 一 小 部 状况 数据 进行 收集 ， 通 过 描述 


统计 学 ， 了 解 样 本 居民 的 消费 状况 ， TRO 计 学 ， 在 对 样本 居民 消费 状况 的 了 解 











情况 下 ， 达 到 对 全 市 居民 总 体 消费 水 平 的 
1.2.2 meinaa A 


1， 理 论 统计 学 PARRA FOEL AX 
统计 学 按照 研究 的 "teu, Te 
KÈK 











Ee IR 一 般 化 、 抽 象 化 ， 5 基础， 从 纯 理 论 的 角度 ， 对 统计 
方法 加 以 推导 论 i 以及 纳 方法 研究 随 规律 。 
应 用 统计 学 侧重 于 统计 学 的 应 用 ，1 1 何 应 用 统计 学 理论 和 方法 ， 对 实际 的 问题 








进行 研究 ，) 示 其 各 种 经 济 现 象 的 规律 性 。 其 目的 是 解决 经 济 存在 的 问题 ， 对 经 济 增长 
进行 预测 。 
2. 理论 统计 学 和 应 用 统计 学 的 关系 


理论 统计 学 和 应 用 统计 学 的 关系 十 分 密切 。 理 论 统计 学 为 应 用 统计 学 提供 了 统计 的 理 
论 和 方法 ， 而 应 用 统计 学 是 理论 统计 学 的 发 展 或 延伸 。 











1.3 ”统计 学 的 基本 内 容 

从 统计 学 的 定义 中 可 以 看 出 统计 学 的 核心 是 数据 ， 所 以 在 学 习 统计 学 内 容 之 前 要 掌握 
数据 的 类 型 。 
1.3.1 ”统计 数据 的 类 型 


统计 学 在 研究 事物 的 数量 方面 是 离 不 开 数据 的 ， 如 研究 股票 价格 变动 水 平 就 要 收集 数 
据 ， 计 算出 股票 价格 指数 的 指标 来 分 析 等 ， 但 数据 不 同 ， 分 析 的 方法 不 同 。 
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总 a s T 


1， 分 类 数据 、 顺 序数 据 、 数 值 型 数据 


按照 计量 尺度 的 不 同 ， 统 计数 据 可 分 为 分 类 数据 、 顺 序数 据 和 数值 数据 。 
定义 1.6 只 归于 某 一 类 别 的 非 数字 型 数据 ， 称 为 分 类 数据 。 
分 类 数据 是 对 事物 进行 分 类 ， 该 数据 表现 的 是 文字 叙述 ， 如 人 口 按 性 别 可 分 为 男 、 女 
两 类 。 

定义 1.7 只 能 归于 某 一 有 序 类 别 的 非 数字 型 数据 ， 称 为 顺序 数据 。 

顺序 数据 也 是 对 事物 进行 分 类 的 结果 ， 如 某 大 学 的 选修 课 以 优 、 良 、 中 、 及 格 和 不 及 
格 分 成 5 级。 

定义 1.8 按 数 字 尺 度 测量 的 观察 值 ， 称 为 数值 数据 。 

数值 数据 是 对 事物 进行 了 准确 的 测量 ， 表 现 具 体 的 数值 ， u 党 的 统计 学 成 绩 。 

在 这 里 要 注意 以 下 两 点 。 

(1) 分 类 数据 是 指 归 于 某 一 类 别 非 数 字 型 数据 ， mau- 有 序 的 类 别 ， 

即 在 分 类 数据 的 基础 上 加 一 个 条 件 “ 有 序 ”。 P. Im 顺序 数据 比分 类 数据 高 一 
层次 。 

O) BUNEA TAEA, RIDE. 例如 ， 某 专业 学 生 的 “ 英 
语 成 绩 ” 为 数值 数据 ， 但 有 时 为 了 了 解 成 绩 的 状况 》 要 对 数据 进行 分 析 ， 即 90 分 以 上 的 学 
生 归 于 优秀 ，80 一 89 分 的 学 : 生 归于 良 既 v\70 和 79 分 的 学 生 归于 中 等 车 ，60 一 69 分 的 学 生 归 
于 及 格 ， 最 后 60 分 以 下 的 归于 不 及 格 x 所 区 说 ， 从 这 个 例子 可 以 得 知 3 种 数据 ， 最 高 级 数 

据 为 数值 数据 ， KE Seenaa 


2， 观 测 数据 和 实验 奖 据 4 


arpa it i 
定义 1.9 通过 调查 或 者 观测 而 收集 到 的 疾 据 ) 称 为 观察 数据 。 

大 有 关 社 会 经 济 现象 的 统 
计数 据 几 乎 部 是 观察 数据 。 

例如 ,《 某 一 时 间 段 ， 某 市 交通 广播 电台 发 布 信息 ， 延 安 大 街 由 南 向 北 车 流量 比较 大 
请 各 位 司机 避让 。 此 数据 “和 车 流量 大 ”就 是 观察 数据 。 再 如 ， 某 人 对 寄居 在 家 中 的 一 帘 欧 
子 很 感 兴趣 ， 他 每 天 观察 并 记录 光子 飞 出 飞 入 的 时 间 ， 以 及 它们 喂养 小 燕子 的 习惯 ， 那 么 
他 得 到 的 燕子 飞 出 飞 入 的 时 间 数 据 即 为 观察 数据 。 

定义 1.10 在 实验 中 控制 实验 对 象 而 收集 到 的 数据 ， 称 为 实验 数据 。 

实验 数据 是 对 事物 进行 了 人 为 控制 而 收集 到 的 数据 。 在 自然 科学 领域 中 所 使 用 的 统计 
数据 大 多 是 实验 数据 。 

例如 ， 某 医药 企业 研发 新 药 ， 数 据 通常 是 通过 对 小 白鼠 进行 实验 而 得 到 的 实验 数据 。 

3. 截面 数据 和 时 间 序 列 数据 

按照 被 描述 的 对 象 与 时 间 之 间 的 关系 ， 统 计数 据 分 为 截面 数据 和 时 间 序列 数据 。 

定义 1.11 在 相同 或 近似 相同 的 时 间 点 上 所 收集 的 数据 ， 描 述 现象 在 某 一 时 点 的 变化 
情况 ， 称 为 截面 数据 。 

定义 112， 在 不 同时 间 上 所 收集 的 数据 ， 用 来 描述 现象 随时 间 而 变化 情况 的 数据 ， 称 
为 时 间 序列 数据 。 
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例如 ，1994 一 1999 年 我 国 国内 生产 总 值 见 表 1-2 所 示 。 























表 1-2 1994 一 1999 年 我 国 国内 生产 总 值 


单位 ， 亿 元 人 民 币 





第 一 产业 第 二 产业 第 三 产业 
































1994 9 457.2 22 372.2 14 930 

1995 | 11 993 28 537.9 | 17 947.2 
1996 | 13 844.2 33 612.9 | 20 427.5 
1997 | 14 211.2 37 222.7 23 028.7 
1998 | 14 552.4 38 619.3 25 173.5 








40 417.9 27 035.8 





14 457.2 


其 中 行 数据 为 截面 数据 ， 列 数据 为 时 间 序列 数据 ， 即 有 (3 型 时 间 序 列 数据 ，6 UQI 
数据 。 


132 统计 学 中 的 几 个 基本 概念 
统计 学 主要 是 想 从 样本 的 信息 推断 出 总 体 的 特征 值 。 在 进行 研究 时 ， 涉 及 很 多 概念 
1， 总 体 和 样本 ROSAN 
定义 1.13 包含 所 研究 的 全 部 个 体 (数据 ) 的 集合 ， 称 为 总 体 
例如 ， 要 检验 一 批 奶 粉 是 否 合格 ， 那 么 这 批 奶粉 梅 成 的 集合 就 是 总 体 ， 其 中 每 一 袋 奶 

粉 就 是 总 体 中 的 个 体 g` 
N C A A i 

时 比较 容易 ,; ANEDE. Win, ERIE, MAXMA ORRA 

是 总 体 ， 较 易 确 定 。 再 如 ， 某 企业 推出 一 种 新 产品 ， 想 了 解 消费 者 是 否 喜 欢 ， 这 时 它 就 需 

要 先 确定 消费 对 象 ， 即 要 确定 消费 这 种 新 产品 的 消费 者 总 体 ， 这 时 该 总 体 的 范围 确定 就 较 

难 。 所 以 说 ， 在 实务 中 ， 我 们 可 根据 自己 的 研究 目的 来 定义 总 体 。 
定义 1L14 从 总 体 中 抽取 一 部 分 个 体重 新 组 成 一 个 集合 ， 称 为 样本 。 
从 总 体 中 抽取 一 部 分 个 体 作为 样本 ， 目 的 是 要 根据 样本 提供 的 有 关 信息 去 推断 总 体 的 

















例如 ， 估 计 一 批 灯泡 的 平均 寿命 ， 不 能 把 所 有 灯泡 点 亮 ， 因 为 这 种 试验 属于 破坏 性 试 
验 。 所 以 要 从 这 批 灯泡 中 随机 抽取 一 小 部 分 作为 样本 ， 进 行 测试 ， 从 而 得 出 样本 的 平均 寿 
命 ， 通 过 此 信息 推断 出 这 批 灯 泡 的 平均 寿命 。 

再 如 ， 研 究 全 国 大 学 生平 均 月 消费 结构 的 状况 。 通 常 全 国 大 学 生 这 个 总 体 的 数据 不 易 
得 到 ， 只 能 抽取 样本 ， 通 过 对 样本 的 信息 研究 推断 出 总 体 的 信息 。 

定义 1.15 ”构成 样本 的 个 体 数目 ， 称 为 样本 容量 ， 或 称 为 样本 量 。 

2. 参数 和 统计 量 

定义 1.16 用 来 描述 总 体 特征 的 概括 性 数字 度量 ， 称 为 参数 。 

参数 是 研究 者 想 要 了 解 总 体 信息 的 特征 值 。 在 统计 学 中 , 我 们 最 关心 的 是 总 体 的 均值 、 
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信息 

































































sr Z= 


总 wanian 


总 体 的 方差 、 总 体 的 比例 等 。 这 些 参 数 通常 是 未 知 的 。 


例如 ， 某 企业 想 了 解 今天 生产 的 这 批 灯泡 的 平均 寿命 ， 即 总 体 的 均值 ， 某 投资 企业 想 





了 解 它 的 投资 组 合 的 风险 ， 即 总 体 方差 ， 某 企业 想 了 解 今天 生产 的 这 批 灯 泡 的 次 品 率 ， 即 


总 体 的 比例 。 























在 统计 中 , 总 体 参 数 通 常用 希腊 字母 表示 , 如 总 体 平均 数 用 j 表示 , 总 体 标准 差 用 o 表 














示 ， 





总 体 比 例 用 zx 表示 等 。 
定义 1.17 用 来 描述 样本 特征 的 概括 性 数字 度量 ， 称 为 统计 量 。 
统计 量 是 根据 样本 数据 计算 出 来 的 一 个 已 知 的 量 。 通 常 ， 最 关心 的 是 样本 的 平均 数 、 
































样本 的 方差 、 样 本 的 比例 等 。 样 本 统计 量 也 用 英文 字母 表示 。 例如， 样本 平均 数 用 表示， 
样本 标准 差 用 s 表示 ， 样 本 比例 用 p 表示 等 。 , 














抽取 样本 的 目的 是 根据 样本 的 统计 量 估计 总 体 的 参数 ， 即 用 样 JIE (ñq 8 ol 























均 数 Jj ， 用 样本 标准 差 s 估计 总 体 的 标准 差 ， a i AJER 


一 种 产品 是 否 消费 , 主要 是 受 产品 的 价格 因素 影 n 但 随 着 经 济 的 发 展 ， 人 们 的 生活 水 平 


3， 变 量 AD 
定义 1.18 说 明 现 象 某 种 特征 的 概念 ， 称 为 变 后 。 
变量 按照 不 同 的 划分 标准 有 不 同 的 分 类 < NG 
(1) 按 数据 的 类 型 ， 变 量 可 分 为 分 类 的 变 蕊 顺序 变量 和 数值 变量 。 
(2) 按 数值 是 否 可 数 ， raon puya. 
s <N 3 
` SA 
14 ”案例 分 o i 
y po Wes) 


A SL 
随 着 经 济 的 快速 发 展 .- 人 们 的 生活 水 平 也 目 RAT- 在 经 济 不 发 达 的 时 候 ， 人 们 对 

















也 在 不 断 地 提高 F 人 们 对 一 种 产品 的 消费 ;, 水 单 单 会 受 产品 的 价格 因素 影响 ， 还 有 其 他 因 


素 ， 如 品牌 \ 疡 品 的 售后 服务 、 产 品 的 外 观 、 性 能 等 因素 的 影响 。 

















啤酒 已 成 为 一 种 日 常 消费 品 进入 千家 万 户 ， 且 啤酒 市 场 的 竞争 也 一 直 从 未 停止 过 ， 各 


类 啤酒 犹如 雨 后 春 算 般 不 断 地 推陈出新 。2003 年 ， 自 我 国 加 入 WTO(World Trade 
Organization， 世 界 贸易 组 织 ) 后 ， 开 放 的 中 国 市 场 已 逐渐 融入 到 了 世界 经 济 的 均衡 游戏 中 。 
尤其 从 2005 年 开始 ， 外 资 进 入 中 国 啤 酒 业 的 步伐 更 为 快速 ， 随 着 外 资 收购 速度 的 加 快 ， 中 



































国 啤酒 市 场 的 竞争 正在 发 生变 化 ， 要 想 在 这 激烈 的 竞争 市 场 中 处 于 不 败 之 地 ， 抓 住 市 场 、 








扩展 市 场 才 是 唯一 的 出 路 。 所 以 有 必要 进行 新 一 轮 的 啤酒 市 场 调查 与 分 析 ， 以 准确 地 知道 
是 哪些 因素 影响 消费 者 的 购买 行为 。 


























要 想 准确 地 知道 是 哪些 因素 影响 消费 者 的 购买 行为 ， 首 先 要 收集 数据 ， 其 次 要 整理 数 








据 ， 再 次 要 分 析 数 据 ， 最 后 解释 数据 ， 从 数据 中 得 出 想 要 的 信息 。 


总 
总 


收集 数据 前 要 确定 研究 的 总 体 。 从 上 面 的 分 析 可 知 ， 总 体 是 购买 啤酒 的 消费 者 ， 这 一 
体 的 范围 很 难 确定 ， 即 总 体 的 数据 很 难 收集 ， 所 以 使 用 推断 性 统计 得 出 总 体 的 信息 ， 即 














收集 样本 的 数据 ， 根 据 样本 的 信息 来 推断 总 体 的 信息 。 





啤酒 市 场 的 调查 与 分 析 流 程 如 图 1.2 所 示 。 
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整理 数据 一 一 建立 调查 结果 的 数据 库 


分 析 数 据 | 上 -一 [啤酒 销售 量 与 其 他 因素 的 相关 分 析 | 


消费 者 行为 预测 分 析 

















解释 数据 
1.2 啤酒 市 场 的 调查 与 分 析 流 程 Nii 


> " S 


kna f CSS 
(2) 工资 。 


(3) 汽车 产量 。 S$ W 
(4) 性 别 。 ` _ 
© re a S s SN 支票 )， PN 


(6) 企业 类 型 。 r; NX 

(7) 员工 对 企业 某 项 sen 赞成 、 中 六 < 反对 、 非 常 反对 )。 

2. 一 家 研究 机 构 从 工 者 中 随机 抽取 了 200 A 
ATE 4 000 z 60% 的 ee 。 试 问 : 

O 该 研 帘 的 意 体 是 什么 ? 样本 是 什么 ? 样本 容 季 为 多 少 ? 

O) Ra 消费 支付 方式 是 什么 类 型 数据 ? 

3. 判断 个 列 哪 些 是 推断 统计 ， 哪 些 是 描述 性 统计 。 
(1) 从 一 个 果园 中 采摘 40 个 苹果 ， 利 用 这 40 个 苹果 的 平均 重量 估计 果园 的 所 有 苹果 的 平均 




















行 调查 ,其 中 40% 的 人 回答 他 人 


] 的 月 收 











(2) 用 条 形 图 描述 某 大 学 某 专 业 学 生 的 成 绩 状 况 。 
(3) 调查 一 个 城市 拥有 汽车 家 庭 的 比例 ， 估 计 全 国 拥有 汽车 家 庭 的 比例 。 














4. 为 了 估计 某 城市 中 拥有 汽车 的 家 庭 比例 ， 抽 取 了 样本 容量 为 500 TRENIN Ær 得 到 拥有 汽车 家 
庭 的 比例 为 35%。 根据 这 一 信息 估计 这 个 城市 拥有 汽车 家 庭 的 比例 为 32%。 试 问 ， 哪 个 数据 是 参数 ? 哪个 





数据 是 统计 量 ? 


EW 


第 2 = 统计 数据 的 收集 与 处 理 


en ) É 
L 了 解数 据 收集 的 主要 方式 和 方法 ， AARTE 
2. 了 解 统计 调查 方案 的 设计 。 9 
3, 掌握 统计 调查 问 痢 设计 的 主要 内 容 。 , Ñ 
4. 掌握 数据 收集 的 软件 操作 过 程 。 XH 


ESAR) R 
NY} 
2010 PAM 次 全 国人 口 3 


rrr Dfe uay kunkan c xi 
生活 中 已 经 充分 呈现 出 出 来 的 各 种 社会 

第 五 次 全 国人 口 车 查 清 了 我 国人 口 在 数量 、 uq 受 教育 程度 、 迁 移 流动 和 居住 环境 等 
方面 的 变化 情况 ， ANM RDIR EE eR, 筹 安 提 排 人 民 的 物质 和 文化 生活 ， 实 施 可 持续 
发 展 战略 ， 社 他 主义 和 谐 社会 ， 提供 科学 准 汪 的 统计 信息 支持 我 国 于 2010 年 11 月 1 B 00:00 开始 
进行 了 第 六 次 淮 国 人 口 普查 . 通过 人 口 普查 的 结果 , 可 以 查 清 全 国 农民 工 问题 、 人 口 老龄 化 的 进展 状况 等 
为 研究 制定 “十 二 五 ”规划 提供 依据 ， 并 为 社会 公众 提供 人 口 信 息 服务 。 


根据 实际 研究 的 问题 ， 进 行 统计 分 析 ， 而 任何 应 用 统计 分 析 问 题 首 先 要 取得 数据 ， 即 
收集 数据 是 统计 分 析 的 前 提 ， 同 时 收集 到 可 靠 准确 、 高 质量 的 数据 是 统计 研究 的 重要 内 容 
之 一 。 本 章 主要 介绍 数据 的 收集 方法 ， 使 学 生 掌握 取得 数据 的 方法 。 有 具体 内 容 包括 数据 的 
来 源 及 不 同 来 源 的 数据 的 处 理 方法 ， 重 点 介绍 直接 来 源 数据 的 收集 方法 及 处 理 的 过 程 。 





24 统计 数据 的 来 源 


从 使 用 者 的 角度 看 ， 统 计数 据 的 来 源 主要 有 两 种 : 一 是 间接 来 源 ， 间 接 来 源 数据 又 称 
二 手数 据 ， 即 别人 已 收集 到 的 数据 ， 不 用 研究 人 员 去 自己 收集 ， 二 是 直接 来 源 ， 直 接 来 源 
数据 又 称 一 手数 据 ， 即 别人 没有 收集 过 的 数据 ， 需 要 研究 人 员 自 己 去 收集 数据 。 
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2.1.1 统计 数据 的 间接 来 源 与 处 理 
1. 间接 来 源 数据 


如 果 与 研究 内 容 有 关 的 原 信息 已 存在 ， 人 们 只 需 对 这 些 原始 信息 进行 重新 加 工 、 整 理 
以 满足 所 需 的 统计 数据 ， 则 称 这 种 数据 为 间接 来 源 的 数据 。 例 如 ， 对 改革 开放 以 来 吉林 省 




















区 域 经 济 发 展 趋势 的 研究 。 针 对 研究 内 容 要 收集 改革 开放 以 来 吉林 省 每 年 的 评价 区 域 经 济 


发 展 的 指标 国内 生产 总 值 ， 而 这 些 数据 是 已 存在 的 ， 即 只 需 到 统计 年 鉴 中 找到 数据 ， 重 新 














整理 ， 这 样 的 数据 就 属于 间接 来 源 数据 。 

















通常 状况 下 ， 间 接 数据 主要 来 源 于 社会 经 济 统计 部 门 公开 出 版 或 公开 报道 的 各 种 报刊 书 





籍 ， 如 公开 出 版 的 《中 国 统计 年 鉴 》《 中 国 社会 统计 年 鉴 》 等 ， < mek W RAPI, 


2. 间接 来 源 数据 的 处 理 











成 本 较 低 ， 用 时 也 较 短 。 





























度 ， 因 为 间接 来 源 数据 并 不 是 针 NARAR 





相对 于 直接 来 源 数据 ， 问 接 来 源 数据 有 很 多 优点 ， as 收集 数据 的 


A EAN A Meoma 者 保持 谨慎 的 态 
究 内 容 而 收集 的 数据 ， 所 以 这 种 数据 可 能 


是 有 欠缺 的 ， Re ' age 数据 可 能 不 准确 ， 失 去 时 效 性 等 。 


因此 ， 在 使 用 间接 来 源 数据 时 需 





一 些 因素 ， 
(1) 数据 是 由 谁 搜集 的 2 k. Aa SMERE. m 
性 的 宏观 数据 ， 与 某 Awek asit, 政府 有 关 部 门 公布 的 数据 可 
O 数据 收集 办 PATER :的 数据 是 值得 怀疑 的 。 


(3) 数据 的 搜集 数据 的 搜集 方法 有 很 多 ， 不 同 的 搜集 方法 所 得 到 





一 般 情况 i 评估 间接 来 源 数据 时 考虑 以 下 


如 ， 对 于 全 国 


| 信 度 更 高 。 


的 数据 的 解释 


力 和 说 用 不 周 的 。 如 果 不 了 解 搜集 "24 很 难 对 数据 的 质量 做 出 客观 的 评价 ， 


即 数据 的 质量 来 源 于 数据 的 产生 过 程 。 
(4) 间接 来 源 数据 的 搜集 时 间 ， 即 注意 数据 的 时 效 性 。 因 为 使 用 “过 时 
研究 内 容 的 结果 。 
(5) 间接 来 源 数 据 的 一 致 性 。 主 要 表现 为 数据 的 计算 口径 是 否 相 同 。 例 




















”数据 会 影响 


如 : 评价 几 家 


保险 公司 本 月 健康 险 的 赔付 , 需要 搜集 这 几 家 保险 公司 的 健康 险 的 本 月 赔付 数据 进行 比较 ， 
这 时 需要 注意 这 几 家 保险 公司 的 赔付 数据 的 计算 口径 是 否 一 致 ， 即 赔付 数据 是 否 包括 了 已 





支付 、 已 发 生 或 已 报告 赔款 。 


最 后 ， 在 引用 间接 来 源 数据 时 ， 应 注 明 数据 的 来 源 ， 以 尊重 他 人 的 劳动 成 果 。 











2.1.2 ”统计 数据 的 直接 来 源 与 处 理 
当 间接 来 源 数据 (二 手数 据 ) 无 法 满足 需要 的 时 候 ， 可 以 亲自 搜集 数据 ， 











直接 来 源 数据 ， 又 称 一 手数 据 。 直 接 来 源 数据 的 主要 来 源 有 两 个 。 一 是 通过 专门 组 织 的 统 














计 调 查获 得 数据 ， 即 调查 数据 。 统 计 调查 是 取得 社会 经 济 数据 的 重要 手段 
试验 得 到 的 数据 ， 即 实验 数据 。 科 学 试验 是 取得 自然 科学 数据 的 主要 手段 。 














。 二 是 通过 科学 


其 中 调查 数据 





有 两 种 常用 的 搜集 方式 一 一 普查 和 抽样 调查 。 普 查 是 指 对 总 体 中 的 个 体 进行 逐一 调查 。 抽 


Wh 


统计 数据 的 收集 与 处 理 ,ss: 第 章 


样 调查 是 按照 一 定 的 筛选 规则 选择 一 部 分 个 体 进行 调查 。 这 里 主要 介绍 抽样 调查 数据 。 














普查 是 专门 组 织 的 ， 一 般 用 来 全 面 调 查 属 于 一 定时 点 上 的 社会 经 济 现象 的 数量 。 例 如 ， 
国 一 般 都 定期 地 进行 各 种 普查 ， 以 便 掌 握 有 关 国 情 、 国 力 的 基本 统计 数据 。 
目的 是 掌握 特定 社会 经 济 现象 的 基本 全 貌 ， 如 为 国家 制定 有 关 政 策 或 措施 提供 
依据 等 。 我国 进行 的 普查 主要 有 人 口 普查 、 农 业 普 查 和 经 济 普查 。 我 国人 口 普查 是 每 隔 10 
年 进行 一 次 ， 每 着 年 份 的 末尾 为 “0” 的 年 份 进 行人 口 普查 ， 如 在 2010 年 11 月 1 日 零 时 进 
T: 我 国 农业 普查 也 是 10 年 进行 一 次 ， 每 着 年 份 的 末尾 为 “6” 的 年 份 进行 农业 普查 ， 经 
济 普查 是 5 年 进行 一 次 ， 每 着 年 份 的 末尾 为 “3” 和 “8” 的 年 份 进行 。 
由 于 普查 是 对 研究 对 象 进行 全 面 的 调查 ,， 即 普查 涉及 的 面 广 ， FERRNA 物力 、 
财力 和 时 间 ， 因 此 普查 间隔 的 时 间 较 长 。 ee 说 , 需要 时 时 刻 刻 了 解 外 
境 及 内 境 的 变化 情况 ， 需 要 时 时 刻 刻 进行 调查 ， WA 样 调查 。 


2. 抽样 调查 


ao 并 根据 样本 调 
查 结果 来 推断 总 体 特征 的 数据 采集 方法 。 抽 是 实际 中 应 用 最 广泛 的 一 种 调查 方式 。 
抽样 调查 具有 以 下 特点 。 

(1) 经 济 性 。 调 查 的 样本 单 人 iè 单位 的 一 小 部 分 ， 调 查 的 工作 量 小 ， 因 而 可 
以 省 力 、 省 时 ， 调查 的 成 本 较 低 。> 

(2) 时 效 性 较 高 。 由 手 插 樟 调查 只 是 调查 总 体 中 ZANA, 因此 调查 的 准备 时 间 较 
短 ， 调 查 时 间 也 较 短 数据 的 处 理 时 间 同 样 较 短 ， 高 了 数据 的 时 效 性 。 

O 适用 面 广 。 从 适用 范围 和 问题 来 看 ， 能 调查 到 全 面 调查 所 能 调查 的 现 
re 

(4) 准确 性 较 高 。 抽 样 调查 中 的 样本 误差 ”在 调查 前 就 可 以 根据 调查 样本 数量 和 总 体 
中 各 单位 作 间 的 差异 程度 进行 计算 ， 可 以 把 样本 误差 控制 在 一 定 范围 之 内 ， 调 查 结果 的 准 
确 程度 比较 有 把 握 。 



























































































































































22 ”抽样 调查 数据 的 收集 


普查 工作 耗费 人 力 、 物 力 较 大 ， 时 间 较 长 ， 常 因 总 体 资 料 取得 不 易 而 无 法 进行 ， 而 抽 
样 调查 的 方法 因 具 有 准确 性 高 、 成 本 低 、 速 度 快 、 应 用 面 广 等 优点 ， 是 企业 中 运用 最 为 普 
遍 的 调查 方式 , 也 是 市 场 经 济 国家 在 实地 调查 方法 上 的 必然 选择 。 在 一 项 调查 工作 开始 前 ， 
首先 要 对 调查 工作 进行 设计 ， 即 设计 调查 方案 。 


221 调查 方案 的 设计 


调查 方案 的 设计 是 指 事先 制订 出 一 个 科学 、 严 密 、 可 行 的 工作 计划 并 组 织 实施 ， 以 便 
在 调查 过 程 中 统一 认识 、 统 一 内 容 、 统 一 方法 、 统 一 步调 ， 圆 满 完成 调查 任务 ， 即 包括 整 
个 调查 工作 过 程 的 内 容 。 
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调查 范围 和 内 容 及 方法 。 


调查 方案 的 设计 包括 以 下 内 容 。 
1. 确定 调查 目的 
明确 调查 目的 是 调查 设计 的 首要 问题 ， 只 有 明确 了 调查 的 目的 ， 才 能 确定 研究 人 员 的 














例如 ， 公 司 决定 开发 一 款 新 产品 ， 在 具体 的 研发 之 前 ， 想 要 了 解 目前 市 场 上 同类 产品 


的 销售 情况 、 价 位 、 在 消费 者 心目 中 的 印象 及 消费 者 可 接受 的 产品 价位 等 信息 ， 此 时 市 场 
调查 的 工作 便 是 通过 对 消费 者 和 竞争 产品 的 调查 分 析 ， 找 准 新 产品 的 目标 市 场 和 目标 消费 


群体 ， 即 此 时 的 问卷 调查 的 问题 要 针对 这 一 目的 而 展开 。 

















2. 确定 调查 对 象 和 调查 单位 
在 明确 调查 目的 之 后 ， 针 对 目的 ， mamam — CQ COI 明 











确 数据 由 谁 提供 等 ， 即 要 明确 调查 对 象 和 调查 单位 。 


规定 


E% 


ls 


单位 
取 调 
述 ， 
同 于 


的 的 








在 确定 调查 对 象 和 调查 单位 时 ， 需 要 注意 确定 的 eds 学 的 理论 作 指导 ， 严 格 
ee 调查 记录 由 于 界限 不 清 而 发 
错 。 
例如 ， 以 城市 职工 为 调查 对 象 ， 就 应 明 k sas 划 清 城市 职工 与 非 城市 职 
A qa 

方法 


3. 决定 抽样 调查 的 方法 及 


1) 抽样 调查 的 方法 JS 

样 调查 的 方式 有 很 区; emin, Sisi yA 概率 抽样 和 非 概率 抽样 。 
(D 概率 抽样 。 概 素 抽样 也 称 随机 抽样 照 隐 宙 原则 进行 的 抽样 ， 总 体 中 每 个 
都 有 一 定 的 机 会 被 选 入 样本 。 其 中 随机 原则 是 指 在 抽取 样本 时 排除 主观 上 有 意识 地 抽 
查 单位 ， 使 每 个 单位 都 有 一 定 的 机 全 irn 注意 随机 不 是 随便 ， 随 机 用 概率 来 描 
而 随便 则 带 有 人 为 主观 的 因素 。 i RENNA 一 定 的 机 会 被 选 入 样本 ， 不 等 
每 个 单位 都 以 相同 的 概率 被 抽 中 ， 而 是 指 每 个 单位 被 抽 中 的 概率 为 非 零 。 

概率 抽样 的 方式 有 以 下 5 种 。 
O 简单 随机 抽样 。 简 单 随机 抽样 也 称 纯 随 机 抽样 ， 就 是 在 总 体 单位 中 不 进行 任何 有 目 
选择 ， 完 全 按 随机 原则 抽取 样本 单位 。 由 于 市 场 调研 的 总 体 范围 较 广 ， 总 体内 部 各 个 
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个 体 之 间 的 差异 较 大 ， 一 般 不 直接 采用 这 种 抽样 的 方法 ， 而 是 与 其 他 抽样 方法 相 结合 。 


不 同 





© 分 层 抽样 。 分 层 抽样 是 将 抽样 单位 按 某 种 特征 或 某 种 规则 划分 为 不 同 的 层 , 然后 从 
的 层 中 独立 、 随 机 地 抽取 样本 。 将 各 层 的 样本 结合 起 来 ， 对 总 体 的 目标 量 进行 估计 。 
例如 ， 研 究 在 校 大 学 生 对 图 书馆 的 利用 率 。 抽 取样 本 时 ， 先 按 专业 将 所 有 的 在 校 大 学 

















生 分 不 同 层 ， 然 后 按照 总 体 中 不 同 层 的 学 生 比例 ， 从 不 同 专业 中 抽取 若干 名 学 生 组 成 在 校 


大 学 








生 的 抽取 样本 。 
分 层 抽样 的 优点 有 很 多 ， 如 抽样 方法 保证 了 样本 中 包含 有 各 种 特征 的 抽样 单位 ， 样 本 














的 结构 与 总 体 的 结构 比较 相近 ， 从 而 可 以 有 效 地 提高 估计 的 精度 ， 再 如 ， 分 层 抽样 不 仅 可 


以 对 


然后 


总 体 参数 进行 估计 ， 还 可 以 对 各 层 的 目标 量 进行 估计 。 
© 整 群 抽样 。 整 群 抽 样 是 指 先 将 总 体 中 若干 个 单位 合并 为 组 ( 群 ), 抽样 时 直接 抽取 群 ， 
对 选中 的 群 中 的 所 有 单位 进行 全 部 调查 。 
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例如 ， 研 究 在 校 大 学 生 对 统计 学 这 门 课程 的 认识 。 先 采用 整 群 抽样 ， 按 学 校 的 名 称 把 
在 校 大 学 生 分 成 若干 个 群 ， 如 清华 大 学 的 学 生 、 北 京 大 学 的 学 生 …… 然 后 从 这 些 群 中 抽取 
一 个 群 ， 作 为 总 体 的 样本 ， 对 抽 中 的 群 中 所 有 在 校 大 学 生 实 施 调查 。 
整 群 抽样 的 优点 : 群 通常 由 那些 地 理 位 置 邻近 的 或 隶属 于 同一 系统 的 单位 构成 , 因此 
调查 的 地 点 相对 集中 ， 从 而 节省 了 调查 费用 ， 方 便 了 调查 的 实施 。 
整 群 抽 样 的 缺点 : 估计 的 精度 较 差 ， 因 为 同一 群 内 的 单位 或 多 或 少 地 有 些 相似 ， 在 样 
本 量 相同 的 条 件 下 ， 抽 样 误差 通常 较 大 ， 导 致 精度 较 差 
© 系统 抽样 。 系 统 抽样 是 指 将 总 体 中 的 所 有 单位 按 一 定 的 顺序 排列 ,在 规定 的 范围 内 
随机 地 抽取 一 个 单位 作为 初始 单位 ， 然 后 按 事 先 规定 好 的 规则 确定 其 他 样本 单位 。 
例如 ， 先 将 总 体 中 的 个 体 随机 排序 并 编号 ， 规 定 抽取 号 码 为 双 号 ? 随机 地 抽取 4 号 作 
为 初始 单位 ， 共 抽取 样本 容量 为 40 的 样本 。 按照 系 统 抽 样 抽取 的 本 水中 个 体 有 4 号 、6 号 
8 号 …… 直 到 抽取 40 个 个 体 为 止 。 
ns 
地 提高 估计 的 精度 。 系 统 抽样 的 主要 缺点 点 是 对 佑 计量 的 估计 比较 困 
@ 多 阶段 抽样 。 多 阶段 抽样 是 指 分 两 个 及 at -种 提 
样 调查 方法 ， 即 先 粗 分 ， 再 细 分 ， GE 
We l upas ra 


































































































方法 。 





首先 ， 针 对 全 省 居 "w. PA 、 区 依 一 定 比例 随机 抽出 100 个 
个 体 (各 市 、 县 、 区 均 有 ) 人 
其 次 ， 在 这 100 个 个 体 所 ”以 镇 、 街 首 为 类 ， ao 
最 后 ， 在 村 (居委会 以 户 为 单位 ， 随 机 抽出 5 本 ， as na 
以 上 介绍 了 了 及 各 常见 玖 概率 抽样 方式 ， pre 结果 ， 计 算 估计 
量 误差 eh 。 也 可 以 按照 要 求 的 精确 度 ， 计 算 必 
要 的 样 目 ， 此 类 问题 将 在 第 5 pi 

(2) 非 峰 洽 抽 样 。 非 概率 抽样 是 指 抽样 时 不 是 依据 随机 原则 ， 而 是 根据 研究 目的 对 数 
据 的 要 求 ， 采 用 某 种 方式 从 总 体 中 抽出 部 分 单位 对 其 进行 调查 研究 。 非 概率 抽样 有 以 下 几 
种 常见 的 方法 。 

O 方便 抽样 。 方便 抽样 又 称 偶遇 抽样 ， 即 调查 员 依据 方便 的 原则 ， 自 行 确定 抽取 的 样 
本 单位 。 

例如 ， 调 研 者 在 路 上 或 其 他 地 方 ， 如 快餐 店 或 便利 店 等 ， 拦 下 行人 进行 访问 就 是 一 种 
方便 抽样 。 再 如 ， 研 究 某 城市 居民 购房 需求 的 状况 ， 调 研 者 在 此 城市 房 交会 门口 拦 下 每 个 
从 房 交 会 出 来 的 人 进行 调查 研究 。 

方便 抽样 的 优点 ， 简便 易 行 ， 能 及 时 获得 所 需要 的 信息 数据 ， 省 时 省 力 ， 节 省 调研 经 
费 ， 效 率 很 高 ， 并 能 为 非 正式 的 探索 性 研究 提供 很 好 的 数据 源 。 

方便 抽样 的 缺点 样本 的 偶然 性 较 高 ， 存 在 选择 的 偏差 ， 即 样本 的 代表 性 较 差 ， 调 查 

结果 可 信 度 较 低 。 所 以 一 般 情 况 下 ， 此 抽样 方法 只 适用 于 探索 性 的 调查 或 正式 调查 前 的 
a 

O 判断 抽样 。 判 断 抽样 是 指 研究 人 员 根据 自己 的 经 验 、 判 断 和 对 研究 对 象 的 了 解 ， 有 
目的 地 选择 一 些 个 体 作为 样本 。 判 断 抽样 一 般 情况 有 两 种 做 法 。 
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种 是 由 专家 判断 决定 所 选 样本 ， 即 选择 最 能 代表 普遍 情况 的 群体 作为 样本 ， 其 中 普 
遍 情 况 的 群体 一 般 选 择 “多 数 型 ”或 “平均 型 ”为 样本 进行 调查 研究 。 

多 数 型 是 指 选择 的 样本 在 调研 的 总 体 中 占 多 数 的 单位 。 例 如 ， 调 查 中 国 钢铁 行业 的 管 
理 机 制 、 运 营 机 制 及 改革 等 状况 ， 所 挑选 的 样本 单位 一 定 得 避 开 鞍钢 、 宝 钢 和 首钢 等 儿 家 
大 型 企业 ， 原 因 是 它们 的 钢铁 产量 占 全 国 钢铁 产量 的 大 半 ， 但 是 它们 的 管理 水 平 、 运 营 能 
力 等 不 能 代表 众多 钢铁 企业 的 现状 。 
平均 型 是 指 选择 的 样本 是 调研 总 体 中 的 能 代表 平均 水 平 的 单位 。 例 如 ， 某 企业 要 调查 
其 自身 产品 与 竞争 对 手 产品 的 销售 情况 ， 根 据 主观 判断 选择 了 一 些 同时 对 销售 双方 产品 有 
影响 的 、 非 常 有 代表 性 的 零售 商店 作为 样本 。 

另 一 种 是 利用 统计 判断 选取 样本 ， 即 利用 总 体 的 全 面 统计 资料 ,按照 主观 设 定 的 某 一 
的 本， 全 和， 让 我国 的 > 人， 这 时 只 于 和 的 宝钢 和 首钢 等 几 
ht TA 
就 相当 于 掌握 了 总 体 产量 的 状况 。 I 

判断 抽样 的 方法 成 本 较 低 ， 也 容易 操作 ， KAAN 为 确定 的 ， 没 有 依据 随机 的 
原则 ， 因 而 调查 结果 不 能 用 于 对 总 体 有 关 参 数 j 

TORT 人 个 体 ， 向 调查 人 员 提 供 
有 关 信 息 ， 如 参与 报刊 上 和 互联 网 上 刊登 问卷 活动 ， 都 属于 自愿 样本 。 

CAO: a: 的 人 群 ， 即 集中 于 对 该 调查 活动 感 兴趣 的 人 
群 ， 因 此 ， 这 种 样本 是 有 偏 的 。 本 仍 可 以 给 a 
以 反映 某 类 群体 的 一 般 看 法 站 
@ 配额 抽样 。 配 额 抽样 是 指 随意 选择 被 调查 的 个 AERE, 年 龄 和 社会 阶层 等 方 
mate wapaanumacr anp.) 抽样 人 群 依赖 于 调查 者 的 喜好 和 调 
查 地 点 。 > EN 
配额 样 的 方法 操作 比较 简单 而 生 可 区 保证 总 体 中 不 同类 别 的 单位 都 能 包括 在 所 抽 
抽样 本 之 中 ,使 得 样本 的 结构 和 总 体 的 结 简 类 似 。 

© 滚雪球 抽样 。 滚 雪 球 抽样 又 称 链 式 抽样 ， 是 指 利用 随机 方法 选 出 初始 受 访 者 ， 然 后 
从 初始 受 访 者 所 提供 的 信息 中 取得 新 的 具有 某 一 特征 的 再 次 受 访 者 ， 依 次 如 此 ， 最 后 通过 
少量 的 样本 单位 逐步 获得 较 多 的 样本 单位 的 方法 。 

滚雪球 抽样 的 主要 优点 是 容易 找到 那些 属于 特定 群体 的 被 调查 者 , 调查 的 成 本 也 较 低 。 
它 适 用 于 对 特定 群体 进行 研究 的 资料 搜集 。 

2) 数据 收集 的 方法 

样本 单位 确定 之 后 ， 对 这 些 单位 实施 调查 ， 即 从 样本 单位 得 到 所 需要 的 数据 。 数 据 收 
集 的 方法 主要 有 以 下 几 种 。 

(1) 自 填 式 。 自 填 式 指 在 没有 调查 员 协 助 的 情况 下 由 被 调查 者 自己 填写 ， 完 成 调查 问 
卷 。 把 问卷 递送 给 被 调查 者 的 方法 有 很 多 ， 如 调查 员 分 发 、 调 查 员 邮 寄 、 调 查 员 通过 网 络 
发 送 等 ， 本 书 的 案例 以 调查 员 邮 寄 方式 为 主 。 

O 面 访 式 。 面 访 式 是 指 现场 调查 中 调查 员 与 被 调查 者 面对面 ， 调 查 员 提问 、 被 调查 
者 回答 的 调查 方式 。 这 种 调查 方式 回收 率 较 高 ， 但 成 本 也 较 高 。 

(3) 电话 式 。 电 话 式 是 指 调查 人 员 通 过 打 电 话 的 方式 向 被 调查 者 实施 调查 。 这 种 调查 
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的 方式 速度 快 ， 


能 够 在 短 时 间 内 完成 调查 。 虽 然 
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电话 式 可 以 在 短 时 间 内 得 到 数据 ， 但 它 也 








有 很 多 局 限 性 ， 如 对 方 较 忙 无 时 间接 听 ， 或 无 人 接听 ， 或 被 研究 对 象 无 电话 等 。 
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问卷 调查 法 又 称 问卷 法 ， 是 以 问题 的 形式 设计 问卷 ， 问 题 体 现 要 调查 的 内 容 ， 以 统一 
的 方式 向 被 选取 的 样本 实施 调查 ， 收 集 调 查 的 内 容 。 

设计 问卷 是 调查 的 关键 部 分 。 因 为 设计 问卷 是 调查 者 得 到 数据 的 方法 ， 而 数据 的 质量 
关系 到 最 后 的 分 析 结果 。 所 以 说 ， 完 美的 问卷 必须 具备 两 个 功能 : 一 是 能 将 问题 传达 给 被 
问 的 人 ， 二 是 使 被 问 者 乐于 回答 ， 使 调查 者 收集 到 有 效 的 数据 。 要 完成 这 两 个 功能 ， 设 计 
问卷 时 应 当 遵循 一 定 的 原则 和 程序 ， 运 用 一 定 的 技巧 。 

1. 问卷 设计 的 原则 K 

1) 有 明确 的 主题 S> 

ee te 
重点 突出 ， 不 能 出 现 可 有 可 无 的 问题 。 a q 

2) 问卷 的 结构 要 合理 、 逻 辑 性 要 强 


问 
先 具 体 后 抽象 。 这 样 也 有 助 于 调查 者 得 到 有 
3) 通俗 易 懂 

问卷 中 问卷 要 通俗 易 懂 ， 不 能 

实 回答 。 要 达到 此 目的 ， 需 注意 以 

es eg 
如 ,“ 您 认为 软饮料 的 
" s 

(2) 对 名 
否 准备 ; "aN S 
问 法 简单 
的 结论 也 缺乏 客观 性 ， 可 信 度 偏 低 。 

(3) 避免 隐 含 选择 、 隐 含 假设 。 例 如 : 
个 假设 ,假设 所 有 的 被 调查 者 都 有 工作 。 

4) 控制 问卷 的 长 度 
卷 的 长 度 通常 
不 能 浪费 一 个 问 句 ， 也 不 要 遗漏 一 
5) 便于 资料 的 校 验 、 整 理 
问卷 是 抽样 调查 
卷 时 一 定 要 考虑 资料 的 校 验 、 
. 问卷 设计 的 程序 
卷 设计 的 程序 包括 下 列 几 个 步骤 。 
把 握 调研 的 目的 和 内 容 








问题 将 容易 使 被 调 
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E 和 统计 
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设计 
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E; 








up Æ 


卷 中 的 问题 排列 要 合理 ， 要 符合 应 答 


TA 
K 


收集 数据 的 主要 方法 ， 只 





质 


全 应答 者 的 理解 能 力 
充分 吗 ? ”这 个 问题 中 下 


BERR s ferias, 


“您 目 


答 问卷 的 时 间 来 控制 ， 
个 问 句 ， 即 问 


有 
数据 的 整理 和 统计 。 


的 数据 


m 晶 的 专业 术语 ， Fai - 目 了 然 ， 并 愿意 如 











i P aait 
了 技术 用 语 “ 分 销 ”4 





专业 用 语 。 例 
民 难 让 所 有 的 被 





in, B “x x 牌 的 产品 质 优 价 廉 ， 
导 性 提问 得 出 肯定 性 的 结 L o s 


结论 ， 这 样 不 能 反映 消费 者 对 商品 的 真实 态度 和 真正 的 购买 意愿 ， 所 以 产生 


前 从 事 什 么 事业 ? ”这 个 问题 就 隐 含 了 一 


讨 间 在 20 分 钟 左右 。 也 就 是 说 ， 问 卷 设计 
题 应 简明 扼要 ， 应 尽量 避免 太 长 的 题目 。 





把 数据 整理 后 ， 才 能 进行 数据 分 析 ， 所 以 ， 


卷 设 计 的 第 一 步 就 是 要 把 握 调研 的 目的 和 内 容 。 这 一 步骤 的 实质 是 规定 设计 问卷 所 
息 。 


SSE 
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2) 确定 调查 方法 的 类 型 

不 同类 型 的 调查 方式 对 问卷 设计 是 有 影响 的 。 

例如 ， 在 面 访 调查 中 ， 如 果 是 入 户 访问 的 话 ， 被 调查 者 可 以 看 到 问题 并 可 以 与 调查 人 
员 面 对 面 地 交谈 ， 因 此 可 以 询问 较 长 的 、 复 杂 的 和 各 种 类 型 的 问题 。 如 果 是 街 上 进行 拦截 
式 的 面对面 访谈 就 比 入 户 访问 有 更 多 的 限制 ， 如 时 间 上 的 限制 ， 这 时 的 问卷 就 不 能 询问 较 
长 的 、 复 杂 的 问题 

再 如 ， 在 电话 访问 中 ， 被 调查 者 可 以 与 调查 员 交谈 ， 但 是 看 不 到 问卷 ， 这 就 决定 了 只 
能 问 一 些 短 的 和 比较 简单 的 问题 。 邮 寄 问 卷 是 自己 独自 填写 的 ， 被 调查 者 与 调研 者 没有 直 
接 的 交流 ， 因 此 问题 也 应 简单 些 并 要 给 出 详细 的 指导 语 。 

3) 确定 每 个 问答 题 的 内 容 

决定 了 访问 方法 的 类 型 ， 下 _ 步 就 是 确定 每 个 间 答 是 的 内 判 Ke 个 问答 天 应 包括 
什么 。 < 

每 个 问答 题 的 内 容 设 计 满足 以 下 两 项 原则 。 AD 
(1) 必要 性 。 SS- 9 必要 性 ， 不 要 出 现 可 有 可 无 的 






































问题 。 
(2) 目的 性 。 目的 性 是 指 问卷 中 的 每 一 AR 贡献 ， 或 服务 
于 某 些 特定 的 目的 。 at 
该 取消 。 
当然 有 些 时 候 ， EN sunni anqas IBD, 这 些 没有 
开头 ， WEER 





ps waya 于 介入 此 调查 中 。 
4) 决定 问答 题 的 
一 般 来 说 , -调查 问 关 a pm, 
(1) 开放 性 间 题 是 一 种 被 调查 者 用 DA 看 言 自 由 回答 和 解释 有 关 想 法 的 问题 








调查 者 对 亲 才 中 的 站 是 不 具体 提供 说 su. 例如 ,“ 您 为 什么 喜欢 XX 可 乐 的 电视 
广告 ? ”74 
开放 性 问题 的 优点 是 ， 提 问 比较 简单 ， 回 答 比 较真 实 ， 即 数据 的 质量 较 高 。 但 它 的 缺 
点 是 ， 难 以 统计 分 析 ， 即 难以 量化 。 因 此 ， 开 放 性 问题 在 探索 性 调研 中 很 有 帮助 ， 但 在 大 
规模 的 抽样 调查 中 ， 它 就 整 大 于 利 了 。 
(2) 封闭 性 问答 题 是 指 问卷 调查 中 的 问题 要 事先 设计 好 各 种 可 能 的 答案 的 问题 ， 由 被 
调查 者 从 备 选 的 答案 中 选 定 一 个 或 几 个 即 可 。 
例如 ， 您 购买 住房 时 考虑 的 主要 因素 是 什么 ? 
周边 环境 
价格 
e 
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ahy 
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收 率 ; 











于 答案 标准 化 ， 因此 封闭 性 问答 题 的 优点 是 回答 方便 ， 有 利于 提高 问卷 的 
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易于 进行 各 种 统计 处 理 和 统计 分 析 。 其 缺点 是 被 调查 者 只 能 在 规定 的 范围 内 回答 ， 无 法 表 
达 自 己 的 真实 想法 ， 即 存在 着 一 定 的 偏差 。 所 以 此 问答 题 的 方式 只 适用 于 收集 被 调查 者 已 
经 有 明确 看 法 的 意向 调查 ， 不 适用 于 初步 探索 性 调查 。 

5) 决定 问题 的 措辞 

问题 的 措辞 是 指 将 想 要 的 问题 内 容 和 结构 ， 翻 译 成 调查 对 象 可 以 清楚 而 轻松 地 理解 的 
用 语 。 主 要 包括 以 下 几 点 。 

(1) 问题 的 措辞 要 求 多 用 普通 用 语 、 语 法 ， 如 果 必 须要 用 专业 术语 ， 必 须 对 其 加 以 
解释 。 

O 要 避免 一 句 话 中 使 用 两 个 以 上 的 同类 概念 或 双重 否定 语 。 

(3) 要 防止 诱导 性 、 暗 示 性 的 问题 ， 以 免 影响 回 卷 者 的 思考 。 上 

(4) 问 及 敏感 性 的 问题 时 要 讲究 技巧 。 K 

(5) 行文 要 浅显 易 读 ， 要 考虑 到 回 卷 者 的 知 让 pt 要 超过 回 卷 者 的 领 
悟 能 力 。 
(6) 可 运用 方言 ， 访 问 时 更 是 如 此 。 Sa 
6) 安排 问题 的 顺序 

通常 问卷 的 问题 安排 顺序 为 先 浅 后 深 、 A E 所 以 最 初 安排 的 问 
eh oti 兴趣 。 核 心 问题 往往 置 于 问卷 中 间 部 分 。 
即 问卷 中 间 题 的 顺序 一 般 按 下 列 规 见 

n inumn, AUAN, AAZ 
的 事实 性 问题 放 卷首 。 A 
(2) 封闭 性 问题 放 前 面 开 放 性 问题 放 后 面 。 因 为 ei 
和 组 织 语言 ， 放 在 前 面 估 引 起 应 答 a z $ 者 会 中 途 放弃 。 





















































































































































O 要 注意 问题 的 罗氏 顺序 ， 按 时 间 顺序 、 美 别 顺序 等 合理 排列 。 
7) 确定 格式 和 排版 
问 式 及 问卷 的 排版 都 会 对 结果 滋生 显著 的 影响 。 格 式 有 3 种 ， 行 式 排列 、 列 式 











HEZI FIEKE HEZI 
(1) 行 式 排列 ， 即 将 所 有 备 选项 排 成 一 行 的 排列 方式 。 
例如 ， 您 购买 住房 时 考虑 的 主要 因素 是 什么 ? 
A. 价格 B. 面积 C. 交通 情况 D. 周边 环境 E. 格局 
(2) 列 式 排列 ， 即 将 所 有 备 选项 排 成 一 列 ， 放 在 每 个 问题 下 边 的 排列 方式 。 
例如 ， 您 购买 住房 时 考虑 的 主要 因素 是 什么 ? 
A. 价格 B. 面积 C. 交通 情况 D. 周边 环境 
E. 格局 F. 施工 质量 
G) 矩阵 式 排 列 ， 即 当 多 个 问题 具有 相同 的 选项 时 ， 可 将 其 设计 成 矩阵 式 。 
例如 ， 依 您 对 下 列 问 题 的 同意 程度 进行 适当 的 选择 : 

非常 同意 ”同意 p 不 同意 非常 不 同意 





















































D 粮食 价格 应 降低 10% Ë oa J YO f T | | 
@ 粮食 价格 应 保持 稳定 [ 3 E tE -E 1] Ë 可 
@ 粮食 价格 应 提高 10% 以 下 [ ] [ 1 I ] [|] OE 
© 粮食 价格 应 提高 10%~20% [ ] [ ] [ 1 I ] | 
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8) 拟定 问卷 的 初稿 和 预 调查 

以 上 的 程序 全 部 完成 ， 即 完成 了 问卷 的 初稿 。 拟 定好 问卷 的 初稿 后 ， 得 到 管理 层 的 认 
可 后 ， 必 须 进 行 预 调 查 。 

预 调查 要 以 最 终 调查 的 相同 形式 进行 ， 如 果 调 查 是 入 户 调查 ， 预 调查 也 应 当 采 用 入 户 
的 形式 。 在 预 调查 完成 后 ， 任 何 需 要 改变 的 地 方 都 应 当 切 实 修改 。 在 进行 实地 调查 前 ， 问 
卷 应 当 再 一 次 获得 各 方 的 认可 ， 如 果 预 调查 导致 问卷 产生 较 大 的 改动 ， 需 要 进行 第 二 次 的 
预 调查 。 

9) 设计 正式 问卷 
a G 主体 、 致 谢 语 4 项 
(1) 标题 。 每 份 问卷 都 有 一 个 研究 主题 。 IKET SERREN 个 题目 ， 反 映 这 
究 主题 ， 使 人 一 目 了 然 ， p ATA a ¿ 

(2) 说 明 。 说 明 可 以 让 被 调查 者 了 解 调查 的 目的 和 内 容 * ETA, WA 
调查 的 目的 和 意义 ， 填 答 问卷 的 要 求 和 注意 事项 ， a asr ss À, 
说 明 通常 放 在 问卷 的 前 面 ， 篇 幅 宜 小 不 宜 大 ， 一 般 以 为 宜 。 

(3) 主体 。 主 体 是 指 问卷 的 核心 部 分 ， 即 问 从 形式 上 看 ， 问 题 可 分 为 开放 
式 和 封闭 式 两 种 。 从 内 容 上 看 ， 可 以 分 为 事实 UN 困窘 性 问题 等 ( 详 见 
下 面 的 3 种 问卷 设计 技巧 )。 f 

Ta A :的 协议 ， 研 究 者 应 当 在 问卷 的 末端 写 上 感 
谢 的 话 。 但 如 果 前 面 的 说 明 中 含 感谢 的 话语 ， 末 端 可 不 用 

在 问卷 设计 完成 后 ， 进 人 问 调查 的 实施 及 数据 的 回 理 (此 内 容 将 在 2.4 节 中 详 
细 讲 解 )。 SHN ys A 

x 


3. 问卷 设计 的 技 3 K 


D 事实 性 问题 
问 ee 取 事实 资料 。 
和 性 别 、 年 龄 、 职 业 、 
收入 、 家 庭 状 况 、 居 住 环境 、 教 育 程度 等 。 这 些 问 题 又 称 为 “分 类 性 问题 ” 因为 可 根据 所 
获得 的 资料 而 将 应 答 者 分 类 。 在 问卷 设计 之 中 ， 通 常 将 事实 性 问题 放 在 前 面 。 
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2) 意见 性 问题 
在 问卷 中 ， 往 往 会 询问 应 答 者 一 些 有 关 意 见 或 态度 的 问题 。 例 如 :“ 你 是 否 喜欢 X X 品 
牌 饮料 ? ” 





意见 性 问题 事实 上 即 态度 调查 问题 ， 关 键 在 于 被 调查 者 是 否 愿意 表达 他 真正 的 态度 。 

这 种 问题 通常 有 两 种 方法 提问 ， 一 种 方法 是 对 意见 性 问题 的 答案 只 用 百分比 表示 ; 另 一 种 

方法 则 旨 在 衡量 应 答 者 的 态度 ， 故 可 将 答案 化 成 分 数 。 

3) 困窘 性 问题 

困窘 性 问题 是 指 应 答 者 不 愿 在 调查 员 面前 作答 的 某 些 问 题 ， 如 关于 私人 的 问题 ， 或 不 

为 一 般 社会 道德 所 接纳 的 行为 、 态 度 的 问题 ， 但 由 于 调查 的 需要 必须 获得 困窘 性 问题 的 答 

案 。 为 避免 被 调查 者 在 应 答 时 做 不 真实 回答 ， 可 采用 以 下 方法 : 
(1) 间接 问题 法 。 是 指 那些 不 宜 于 直接 回答 ， 而 采用 间接 提问 的 方式 得 到 所 需 答案 的 

问题 。 这 种 提问 法 考虑 到 被 调查 者 的 顾虑 。 例 如 ,“ 你 同 他 们 的 看 法 是 否 一 样 ? ” 
(2) 断定 性 问题 。 有 些 问题 是 先 假定 应 答 者 已 有 该 种 态度 或 行为 。 例 如 ,“ 你 每 天 抽 多 
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少 支 香烟 ? ”事实 上 该 应 答 者 极 可 能 根本 不 抽烟 ， 这 种 问题 则 为 断定 性 问题 。 正 确 处 理 这 


种 问题 的 方法 是 在 断定 性 问题 之 前 加 一 问题 ， 如 “你 抽烟 吗 ? ”， 如 果 应 答 者 
断定 性 问题 继续 问 下 去 才 有 意义 ， 否 则 在 过 滤 问 题 后 就 应 停止 























G3) 








EJ 











答 “ 是 ” 








假设 性 问题 。 即 通过 假设 某 一 情景 或 现象 存在 而 向 被 调查 者 提出 的 问题 。 例如 “如 


果 XX 矿 泉水 涨 至 3 元 ， 你 是 否 将 改 喝 未 涨 价 的 饮料 ? ” 


23 ”统计 数据 质量 


统计 数据 的 质量 直接 影响 到 统计 分 析 的 结论 。 为 确保 统计 数据 的 质量 ， 在 数据 收集 、 
整理 、 分 析 各 阶段 都 应 尽 可 能 减 小 误差 ， 尤 其 是 在 数据 收集 阶段 。 去 











2.3.1 统计 数据 的 误差 GQ 
统计 数据 的 误差 是 指 统计 数据 与 客观 现实 之 间 的 差 TO 
误差 和 非 抽样 误差 。 


抽 


生 原 因 一 般 有 以 下 几 种。 








样 误差 是 指 用 样本 推断 总 sania hd S 








(1) 由 于 抽取 样 es ss Es. 
(2) 由 于 样本 结构 与 a R 


- 般 统 计数 据 的 质量 评价 标准 主要 有 6 个 方面 。 




















FA 
抽样 误差 是 无 法 消除 的 ， s L 进行 控制 或 计算 。 例 如 ， 按 研 
求 的 精度 ， 利 用 公 on 


小 样本 容量 。 
tité SERENA TARA | aA 2 例如 ， 





ee ei 抄录 错误 误 等 引起 误差 ， 属 于 非 抽样 误差 ， 再 


调查 者 的 故意 虚 “tutal sf as, > CHT TANA 对 于 非 抽样 误差 来 说 ， 
嘱 种 太 式 调查 部 有 可 能 产生 。 


统 的 质量 要 求 











2 


























(1) 精度 : 最 低 的 抽样 误差 或 随机 误差 。 

(2) 准确 性 : 最 小 的 非 抽样 误差 或 偏差 。 

(3) 关联 性 : 满足 用 户 决策 、 管 理 和 研究 的 需要 。 
(4) 及 时 性 : 在 最 短 的 时 间 里 取得 并 公布 数据 。 


(5) 一 致 性 : 保证 时 间 序 列 的 可 比 性 。 























(6) 最 低 成 本 : 在 满足 以 上 标准 的 前 提 下 ， 以 最 经 济 的 方式 取得 数据 。 


23.3 


k 


降低 统计 数据 误差 的 措施 
非 抽样 误差 减 小 的 措施 


对 于 非 抽样 误差 ， 必 须 采 取 各 种 措施 ， 降 低 或 减 小 可 能 发 生 的 各 种 非 抽 样 误差 ， 把 它 
缩小 到 最 低 限 度 范 围 内 。 主 要 的 措施 有 以 下 两 种 。 

(1) 正确 制定 好 严密 的 调查 方案 ， 详 细 界 定 各 种 调查 项 目 和 计算 方法 。 

(2) 切实 落实 好 调查 方案 的 各 项 内 容 。 











NS 
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2. 抽样 误差 减 小 的 措施 

要 减 小 抽样 误差 ， 一 般 情 况 下 ， 可 在 选择 抽样 调查 单位 环节 下 手 。 例 如 ， 在 抽样 调查 
} 选 取 有 代表 性 的 调查 单位 ; 抽样 调查 遵循 随机 原则 ; 在 抽样 之 前 确定 好 样本 容量 ， 并 保 
证 不 随意 更 换 样本 单位 等 。 


= 





24 案例 分 析 : 啤酒 市 场 的 调查 与 分 析 及 Excel 上 机 
应 用 一 一 数据 的 收集 


2.4.1 ”调查 问卷 的 设计 


ee c yy s À amas 啤酒 
的 行为 习惯 。 从 经 ht ott MANEN, 年 龄 、 学 
历 和 居住 城市 等 个 人 信息 ， 除 此 之 外 S 9 一些 看 法 等 。 根 据 这 些 内 容 
我 们 首先 设计 调查 问卷 。 

1. 设计 问卷 的 说 明和 标题 

RD 分 。 这 部 分 主要 是 对 调查 目的 、 意义 及 填写 
要 求 的 说 明 。 标 题 反 映 这 个 研究 目 了 然 ， 增 强 填 答 者 的 兴趣 和 责任 感 。 根 据 
研究 目的 ， 设计 了 啤酒 消费 者 行为 Ms 


Ter a 
d 啤酒 消费 Ë 
NS ETG ， 以 及 对 啤酒 的 认 知 。 项 望 您 花 
则 完成 读 答 案 ， 再 次 表示 压 谢 
































图 2.1 啤酒 消费 者 行为 调查 表 


EW 





2. 设计 问卷 的 主体 

问卷 主体 是 市 场 调查 所 要 收集 的 主要 信息 ， 它 由 一 个 个 问题 及 相应 的 选择 项 目 组 成 ， 
通过 主体 部 分 问题 的 设计 和 被 调查 者 的 答复 ， 市 场 调查 者 可 以 对 被 调查 者 的 基本 个 人 情况 
和 对 某 一 特定 事物 的 态度 、 意 见 倾向 及 行为 有 较 充 分 的 了 解 。 设 计 步 又 如 下 (本 书 案 例 的 操 
作 全 部 使 用 最 普及 的 Excel 2007 进行 讲解 )。 

第 一 步 : 在 “调查 问卷 ”工作 表 中 输入 如 图 2.2 所 示 的 问卷 题目 。 






































A L B c D | E E G H I 
P. 啤酒 消费 者 行为 调查 

念 好 ! 此 次 调查 主 要 为 了 解 目前 吉林 人 消费 者 议 用 啤酒 的 习惯， 以 及 对 虽 洒 的 认 知 。 项 望 人 花生 
2 要 的 时 间 完 成 该 区 案 ， 再 次 表示 夺 澳 ! 
3 mata, z 
[4 2. 候 的 年 龄 : si 
5 |3. 钨 的 学 历 : ` 
6 4. 忆 住所 市 Z 
了 5. 请 问 息 是 百 唱 过 啤酒 ? (F N REWIOBES) IN 
8 _|6. 息 最 党 喝 的 啤酒 是 嘟 一 种 啤酒 ? ` 
9 BERAREN? L 
10 s. Wl mnttrmg> H 
11 |o. RENTAN ERNETEN: z bN 
12 非常 不 同意 eN Pm me kme) 
13 | (1) RAPPRE =u MA Š 


15 | (3) WNBR. FESS N 4 
16 | (O 啤酒 的 营养 价值 较 高 
17 | (5) 啤酒 味 党 较 藻 ， 不 如 其 他 饮料。 7 


18 |10. 您 是 否 会 再 次 购买 该 品牌 的 啤酒 ? < K 


14 | (2) *iñstwiapikittri NA 
7 


A 











`? 
Ny 

s< N 
2 2 









XA 
X 图 2.2 pangai 

第 二 步 ， ATRW PONR, REO AA AE, A “k 

线 ” 即 取消 网 格 线 ， 得 到 的 结果 如 图 23 所 示 。 
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E G E 





G D E F 
啤酒 消费 者 行为 调查 
您 好 ! 此 次 调查 主要 为 了 解 目前 吉林 省 消费 者 议 用 哩 酒 的 习惯， 以 及 对 啤酒 的 认 和 0。 项 望 您 花费 宝 
2 重 的 时 间 充 肉 读 答 案 ， 再 次 表示 有 测 上 


1 1 


T5 请 问 您 是 否 唱 过 哩 酒 ? (F a EAE 
6. 您 最 党 唱 的 啤酒 是 哪 一 种 啤酒 ? 

7, 您 经 常 从 哪里 购买 啤酒 ? 

40_s. 请 问 你 每 周 的 饮用 量 为 


非 党 不 同意 FAS 中 立 同意 


14 (2) 哗 酒 是 解渴 的 景 佳 议 料 


| 15 (3) omas TES 











图 2.3 ”取消 网 格 后 的 问卷 题目 示意 图 
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第 三 步 : 单 击 “开发 工具 ”一 “插入 ”的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 中 选择 “分 组 
框 ” 选 项 ， 然 后 拖 动 鼠标 ， 在 工作 表 中 适当 的 位 置 创 建 分 组 框 ， 如 图 2.4 所 示 。 


ma mA mman At m sm Sm | F&IR | 











图 === sx 
a rms ss 





























您 好 1 
2 和 二 责 的 时 间 完成 该 答案 ， 再 次 表 采 感谢 1 7 


5 = ANa 
Coe 建 分 组 框 


第 四 步 ， 单 击 es 的 下 拉 按钮 ， 的 下 拉 列 表 中 选择 “选项 
按钮 ”选项 ， 在 上 一 De 六 并 将 选项 按钮 的 名 称 更 改 为 
“gr, 之 后 按 住 Ctrl 个 选项 按钮 该 选项 按钮 放置 于 分 组 框 内 ， 并 将 名 
称 更 改 为 “ 女 ”如 图 2.5 所 示 。 a 





I LT T FN F 
啤酒 消费 者 行为 调查 
此 次 调查 主要 为 了 解 目 前 吉林 省 消费 者 饮用 史 酒 的 习惯, iai, REUE 

















你 好 ! 此 次 调查 主要 为 了 解 目 | E ° s Aa z z À MANDIR, brenian, 
2 费 宝贵 的 时 间 完 成 该 答案 ， 再 次 表 

















三 c D E F 
1 啤酒 消费 者 行为 调查 
您 好 ! 次 王 主 有 为 了 解 员 关 训 信者 消 我 才 太 用 二 抽 的 导 民 ， 以 及 对 啤酒 的 认 知 | 
费 主 贵 的 时 间 完 成 该 答案 ， 再 次 表示 语 谢 | 


i 

£ 

3 LENEA: os Ot 
+ 

5 














LENER: 
了. 您 的 学 历 : 





(b) 选项 按钮 效果 
图 2.5 ”绘制 选项 按钮 
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== 


名 章 





此 时 当 指向 选项 按钮 时 ， 鼠 标 指针 的 形状 会 显示 为 手 状 ， 单 击 ， 将 选中 当前 选项 按钮 。 
第 五 步 : 按照 上 面 的 顺序 ， 依 次 为 问卷 其 他 问题 设计 好 选项 ， 最 后 得 出 的 问卷 题目 及 
选项 如 图 2.6 所 示 。 










































































Las. PE Ln E F G. 7 L Tammah 
Z=] 
E 啤酒 消费 者 行为 调查 
t$! 此 次 调查 主要 为 了 解 目前 吉林 省 消费 者 议 用 啤酒 的 习 民 ， 以 及 对 啤酒 的 认 知 。 项 记念 花费 
2 宝 中 的 时 间 完成 该 答案 ， 再 次 表示 夺 谢 
| 3 emsa: | Os Ox 
4 enr | Oma Ows Owe Osik 
5 |3. 你 的 学 历 ， [ Omespur Oxe OFN ORTER 
6 4. 居住 城市: OKE Ort Onr Ogu 
75. 请 问 你 是否 唱 过 史 酒 ? (F “H" WEEB) | O g F y 
8 e. estwisaw-—ioid? | Orsen Oum Om Qemmem O; TN) 
| 9 17. 您 经 常 从 哪里 购买 哩 酒 ? — O usun Orsa O aman 





















10 8, 请 问候 每 周 的 饮用 量 为 =. 
| 11 9, 依 您 对 下 列 问 题 的 同意 程度 进行 适当 | 
r: 
















o Csoocc-sascr Q 1000cc-2000c: 
的 选择 : 
非常 不 同意 。 不 同意 





13 (D 聚会 时 啤酒 可 增加 热 闲 欢 乐 的 气氛 
14 (2) 啤酒 是 解渴 的 最 佳 饮 料 

15 (3) MRR, FESH 

16 (4) 啤酒 的 营养 价 僧 较 高 

17 | (5) 啤酒 味觉 较 苦 ， 不 如 其 他 饮料 。 
18 |10. 您 是 否 会 再 次 购买 该 品牌 的 啤酒? 
Os OS 


= 调查 问卷 Seti se 
Se Ve noi 
,26 新 没 计 的 调查 问 闪 示人 
第 六 步 : 设计 “提交 间 卷 ”按钮 ， 单 击 “ 插 六 ”之 “ 形 状 ” 的 下 拉 按钮 ， 在 弹出 的 下 
拉 列 表 中 选择 “和 矩形 ”选项 ， 拖 动 鼠 标 ， 在 问卷 的 室 白 处 绘制 矩形 ， 然 后 右 击 矩形 ， 在 弹 
出 的 快捷 菜单 中 透 择 “添加 文字 ”选项 让 添 儿 “提交 问卷 ”文字 ， 如 图 2.7 所 示 。 


入 开始 A | 页 面 布 局 公式 SZ < ë AE 开发 I 内 
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ee EEE ET 










































































最 近 使 用 的 形状 

回国 NN NDOA Ll U 
G45SA( 

ss 

YLLL %04 
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goonauanag 
2 宝贵 的 时 间 完 成 该 答案 ， 再 i EE 

Eb 
3 LANHA: os 


TR! 此 次 调查 主要 为 











4 LENER: Om OOCL) 
PE 











ET 





图 2.7 设计 “提交 ”问卷 按钮 


最 后 , 得 到 最 终 问卷 ， 如 图 2.8 所 示 ( 这 里 主要 介绍 方法 ， 所 以 问卷 就 不 加 以 设计 背 
景 了 )。 





NS 


2.4.2 


动 接收 


第 一 步 : 建立 一 


所 示 的 














| 2 


10 8. 请 问 您 每 周 的 议 用 量 为 
_ 11 9. 依 您 对 下 列 问题 的 同意 程度 进行 适当 的 选择 ， 


ETJ Oa OF 


2 宝贵 的 时 间 完 成 该 答案 ， 再 次 表示 夺 谢 ! 
3 LENEA: os Ox 














看 酒 消费 者 行为 调查 


您 好 ! 此 次 调查 主要 为 了 解 目前 吉林 省 消费 者 议 用 啤酒 的 习惯 ， 以 及 对 啤酒 的 认 和 0。 希 望 入 花 寓 





4 2. 您 的 年 龄 ， | 。 口 20-29 Own 





Owe Ot 























5 13. 您 的 学 历 : 加 高 中 及 以 下 Okt Osy ONERUL 
|5 + Bts, Oks Os Ous Osu 
了 5. 请 问候 是 天 唱 过 啤酒 7 《 答 “ 否 ”请 第 10 题 回答 ) 








3_6. 您 景 党 喝 的 啤酒 是 对 一 种 啤酒? | OFDM ORMA OSTEN Osemsmn QFQxaewmn 











7 您 经 党 从 时时 购买 啤酒 ? [o sma 





Os OQ aman Oxa 











“Oso 








12 | 
13 (1) 聚会 时 啤酒 可 增加 热 疝 欢乐 的 气氛 


14 (D RBRB 

15 (D MABA TESB 

16 (0 RADERAS 

17 (5) ORRE, TASETON 
18 10. 您 是 否 会 再 次 购买 该 品牌 的 嘿 酒 ? 
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动 接收 问卷 结果 的 设置 








AANE TE: AAA 
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PAWE ONE TIEI AA 


PAKER HE. ,本 





GED o 
CRE 





TER, 命名 为 pontas 结果 ”， 并 在 其 


mzs a 
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可 以 通过 设置 自 


aza, “¿Sos HR, 
Ran VAB HA 有 调查 结果 的 方法 。 





G L 
REST semuwm REUNAT DENA RA 


图 2.9 “自动 统计 调查 结果 ”工作 表 


EW 


上 创建 如 图 2.9 


统计 数据 的 收集 与 处 理 ,ss: 第 ” 章 
第 一 步 : 切换 到 “调查 问卷 ” LER, MNA B”, 在 强 出 的 快捷 菜单 中 选择 
“设置 控件 格式 ”选项 ， 如 图 2.10 所 示 ， 弹 出 “设置 控件 格式 ”对 话 杠 。 
| |; 


see TE POT A WE EEE T 
碑 酒 消费 者 行为 调 


| 。 您 好 ! 此 次 调查 主要 为 了 解 目前 吉林 省 消费 者 议 用 啤酒 的 习惯 ， 以 
2 宝贵 的 时 间 完成 该 答案 ， 再 次 表示 感谢 


1. 您 的 性 别 : 

















gl 
4 2. 您 的 年 龄 : 
_ 5 3. 您 的 学 历 : 
6 
7 











4. 居住 城市 
7 5. 请 问 您 是 否 喝 过 啤酒 ? 















6. 您 最 常 喝 的 啤酒 是 哪 一 


7. 您 经 常 从 哪里 购买 啤酒 
10 8. 请问 您 每 周 的 饮用 重 为 
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图 2.10 ense 
第 三 步 : E ERR” HEP A Ga AME, Wa Ay bk 
J” REA RRS A, Jm 2.11 所 示 。 








sesa Ganla | me [ va [Emil 














图 2.11 “设置 控件 格式 ”对 话 框 
第 四 步 : 此 时 ,“ 设 置 控件 格式 ”对 话 框 会 自动 折叠 为 只 显示 一 个 文本 框 ， 单 击 “ 自 动 
统计 调查 结果 ”工作 表 ， 然 后 选 定 “ 自 动 统计 调查 结果 ”工作 表 中 的 A2 单元 格 ， 此 时 该 
单元 格 的 引用 路 径 会 显示 在 对 话 框 的 文本 框 中 ， 如 图 2.12 所 示 。 















































图 2.12 单元 格 的 引用 路 径 显示 结果 


SSE 








第 五 步 : 在 选 定 引 用 的 单元 格 后 ， 单 击 上 一 步 中 对 话 框 的 “关闭 ”按钮 ， 返 回 “设置 
对 象 格式 ”对 话 框 ， 然 后 关闭 “设置 对 象 格式 ”对 话 框 。 
此 时 ， 在 “调查 问卷 ”工作 表 选 中 选项 按钮 “ 男 ” 后 ， 切 换 到 “自动 统计 调查 结果 ” 
工作 表 ， 会 发 现 该 工作 表 的 A2 单元 格 中 自动 出 现 数值 “1”， 如 果 在 “调查 问卷 ”工作 表 
选中 选项 按钮 “ 女 ” 后 ， 切 换 到 “自动 统计 调查 结果 ”工作 表 ， 会 发 现 该 工作 表 的 A2 单 
元 格 中 自动 出 现 数值 “2” 如 图 2.13 所 示 。 


啤酒 消费 者 1 _ 


1 
y Pee el Ls Bal Good 
ET 此 次 调查 主要 为 了 解 目前 吉林 省 消费 者 用 m 
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| r— , 
5 hens: | OspRur — 〇 大 专 <N 
m a B c DM 4 X \ 
E] 啤酒 消费 者 O Cima 
你 好! 此 次 调查 主要 为 了 解 目前 吉林 省 消 + 
”2 宝贵 的 时 间 完 成 该 答案 ， 再 次 表示 感谢 ! 
3 _|1. 您 的 性 别 ， 
4 BNE 
5 3. 您 的 学 历 。 








S NN < 
J Bz msmamemm O. 
第 六 步 ， BIFBE002 DOS 2 (ñm HURREE R. EE AL H ETEA 
应 的 “自动 统计 调查 结果 二 工作 表 中 的 单元 格 链接 。 


243 “自动 统计 调查 结果 TERRORS 
; ji 


J 
制作 MANEA, 接 下 来 要 做 的 工作 就 是 将 问卷 发 送 到 被 调查 者 的 邮箱 。 但 是 ， 
于 被 调查 者 只 需要 看 到 “调查 问卷 ”工作 表 ， 所 以 在 发 送 邮件 之 前 ， 还 需要 进行 隐藏 “ 自 
动 统计 调查 结果 ”工作 表 并 保护 工作 短 。 具 体操 作 如 下 。 
第 一 步 : 切换 到 “自动 统计 调查 结果 ”工作 表 ， 右 击 该 工作 表 ， 在 弹出 的 快捷 菜单 中 
选择 “隐藏 ”选项 ， 如 图 2.14 所 示 。 
























































EAD.. 

BeO 

ESR 

移动 或 复制 工作 雪 (M).… 
EEREV 


RPIERO.. 
ISERO , 








TELAH: 
图 2.14 ”选择 “隐藏 ”选项 

















EW 


统计 数据 的 收集 与 处 理 ,nt; 芒 了 P 


此 时 ,“ 自 动 统计 调查 结果 ”工作 表 就 自动 隐藏 了 ， 如 图 2.15 所 示 。 





14 | (2) 啤酒 是 解渴 的 最 佳 饮料 
15 | (3) 啤酒 易 发 翌 ， 不 宜 多 蝎 
16 | (4) 啤酒 的 营养 价值 较 高 
17 | (5) 啤酒 味 党 较 苦 ， 不 如 其 他 饮料 。 
18 110. 您 是 否 会 再 次 购买 该 品牌 的 啤酒 ? 
oz OF 








图 2.15 “自动 统计 调查 结果 ”工作 表 自 动 隐藏 


第 二 步 : 切换 到 “调查 问卷 ”工作 表 ， 对 该 工作 表 进 行 保护 N “审阅 ”一 “保护 
工作 短 ” 的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 中 选择 na 8 ”选项 ， 弹 出 “保护 结 
构 和 窗口 ”对 话 框 ， 在 “密码 ”文本 框 中 输入 密码 ， í. 2.16 所 示 。 

第 三 步 : 单 击 “ 确 定 ” 按 钮 ， 弹 出 aae i ， a. 如 图 2.17 所 
示 ， 然 后 单 击 “ 确 定 “按钮 。 

, X 


< ER 


时 : pe: eS Amame. muag 























称 的 列表 保存 在 安全 的 地 方 

(村 

图 2.16 R 结构 和 窗口 ”对 话 框 x I 图 2.17 “确认 密码 ”对 话 框 

此 时 次 可 以 把 调查 问卷 发 送 给 被 调 交 着 。 
244 ”调查 结果 资料 库 的 创建 

设 此 次 调查 共 发 送 50 份 电子 邮件 ， 收 到 问卷 结果 35 份 ， 其 中 5 份 问卷 答题 不 符合 要 
求 ， 不 予 统计 ， 下 面 把 另外 30 份 问卷 结果 进行 统计 。 操 作 如 下 。 

第 一 步 ， 打开 “调查 问卷 ”工作 表 ， 单 击 “ 审 阅 ” 一 “保护 工作 德 ”的 下 拉 按 钮 ， 在 


弹出 的 下 拉 列 表 中 选择 “保护 结构 和 窗口 ”选项 ,弹出 “撤销 工作 短 保 护 ” 对 话 框 ,在 “ 密 
码 ” 文 本 框 中 输入 之 前 设置 的 密码 ， 然 后 单 击 “ 确 定 ” 按 钮 ， 如 图 2.18 所 示 。 


HMLA RI 
EBE: e 



















































































e) 


图 2.18 “撤销 工作 簿 保护 ”对 话 框 


第 二 步 : 此 时 显示 “自动 统计 调查 结果 ”工作 表 ， 有 效 的 30 份 问卷 调查 结果 出 现在 该 
工作 表 中 ， 如 图 2.19 所 示 。 











SSE 


统计 学 ( ) 理论 5 实务 — í í í 











Te T pe pe 7 L— LAL. 
W sE SD END ZTSTGESKENES BLEE UAE (O WAAS WE SAN EFE HE REMS 
2 1 4 2 1 1 1 n: 2 3| 4 | s | 4 1 
2 3 3 1 z 2 . s sjo £ £ 
1 2 3 n 1 2 2 3 5 s < $ |2 1 
2 1 s 1 1 2 2 2 4 4 5 3 a 1 
£ 1 2 3 1 4 3 3 5 < 3 3 | 1 
1 2 a 3 1 L 1 4 5 F EM ue Yan es un Br; 1 
2 1 2 2 1 2 z £ 4 rs) 2 a 2 
2 1 2 1 1 2 2 2 5 43 s | 1 
1 2 2 1 1 2 z 4 5 s 2 a 1 1 
1 3 3 2 1 š z 3 5 © a r ESE] 1 
2 2 3 1 1 2 3 2 4 IRE] * |e 1 
1 3 1 3 1 2 t1 3 5 4l 3 [1 1 
1 3: 3 « 1 z 2 4 5 T ET IPT ET 1 
2 1 5 2 1 3 3 1 4 2 | 5 z 4 2 
2 1 5 5 1 1 1 3 5 a 3 |2 1 
1 3 a 1 1 2 2 P 5 slal alı 1 
1 2 1 2 1 2 3 4 5 | 4 1 1 
1 a 3 上 1 3 3 1 3 aIla 3 3 1 
2 2 3 ' 1 2 3 1 3 ala 3 ja 1 
1 2 3 4 1 3 1 4 5 sis | ali 1 
1 1 : 1 1 2 2 4 5 r ES ES TSS BEF EB E ` 1 
1 £ 2 4 1 1 1 . 5 ala zli 1 
2 2 $ 2 1 2 3 4 2l s 3 oa 1 
1 2 a 3 1 1 1 < 5 ELI EBE: 1 
1 3 3 4 1 4 3 4 5 4 Py |z 1 
2 1 a 2 1 2 2 3 4 4 z 1 
1 2 2 1 1 2 3 4 5 s A 1 1 
1 1 3 2 1 3 1 4 s J WAN: 1 
1 1 4 1 1 2 3 4 5 sr X< 1 1 
2 2 3 3 1 1 1 3 E 4 3 z|: 1 





图 2.19 pee 
由 图 2.19 可 知 ， 即 每 位 受 访 者 的 答题 结果 代码 的 形式 显示 在 “自动 统计 调查 





[ 作 表 中 ， 要 把 代码 转换 为 具体 的 内 
: 在 “自动 统计 调查 结果 ” 入 一 个 新 的 工作 表 ， 命 名 为 “编码 设置 "。 
在 “编码 设置 ”工作 表 中 设置 不 同 答 SK 马 ， 如 图 2.20 所 示 。 











I L K 
4 sasawa aivan RAE MERE 再 次 购买 
s 20-29 Wp, Fy š 500CC 以 下 非常 不 同 写 Æ 
30-39 吉林 š A 店 500 一 一 9990C 不 同意 = 
I Aea 1000-20000C py 
—— 其 他 20000C 以 上 ME 
非常 同 富 


40-49 


本 村 松原 
— =: 白山 








| 调查 问卷 自动 统计 调查 结果 编码 设置。Sheet3 Sheetd Sheet5 Sheet6 _ Sheel 





图 2.20 编码 设置 


第 四 步 : 在 “自动 统计 调查 结果 ”工作 表 中 ， 分 别 在 每 列 数据 右 侧 插入 一 个 空白 列 ， 
如 图 2.21 所 示 。 

















BW 


统计 数据 的 收集 与 处 理 ,ss; 第 A 


== 
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7 y 





图 2.21 插入 空 和 列 A O 
第 五 步 : 切换 到 “编码 设置 ”工作 表 ， WENER Al:K6， 然 后 单 击 “ 公 式 ” 一 


Fe mM mms 公式 es sm 
f zex- Q2- Qm- 人 Ó 
an © acampan- A 文本 f maaa 


Drs- Basong- prear 











ç “|> 7 
r P 图 2.22 RE TERREA 


了 在 “定义 名 称 ” 对 话 框 中 的 “名 称 ”文本 框 中 输入 名 称 ， 如 data， 然 后 单 
“确定 ”按钮 ， 如 图 2.23 所 示 。 





Er 

















[= 编码 设置 !$AS1: SKS6 E 
FT 


223 输入 名 称 














网 








NS 


grs (Q megaa TTT 


第 七 步 : 切换 到 “自动 统计 调查 结果 ”工作 表 ， 在 B2 单元 格 中 输入 蔡 代 函数 ， 即 : 
“=VLOOKUP(A2,data,2,FALSE)”， 此 时 B2 单元 格 自动 替换 成 “ 女 ”， 如 











~man le o oe 





me yan jaana ee S 
6 学历 “学历 


À g, 
性 别 j 年 龄 

sai assasi 

1 

1 

2 

2 

1 





第 八 步 : 拖 动 B2 单元 格 右 下 角 的 填充 柄 向 下 复制 公式 ， 蔡 
息 ， 其 结果 如 图 2.25 所 示 。 AAA 





图 2.24 输入 替代 函数 











B2 PA Je | =VLOOKUP (A2, data, 2, FALSE) 
Á B L. x r. a 
性 别 2 年 龄 | 学 学 
2 x 1 WES 4 
1 s 2 sN 3 
1 3 | 3 
2 x 3 
2 2 
1 4 
2 s= 2 
2 È 日 
ne < 5 a ay 
An 8 K3 
= Sa x 3 
SE: x 1 
y aw | z 3 
> 2 x= 3 
WV 2 女 3 
uk J 1 z 4 
> 1 男 1 
` 1 3 3 
2 k 3 
1 男 3 
1 男 3 
1 男 2 
2 x= 3 
1 男 4 
1 8 3 
2 z. 4 
1 z 2 
1 B 3 
1 x 4 
2 z 3 

















图 2.25 ”替换 每 位 受 访 者 的 性 别 信息 














2.24 所 示 。 


Na Ei ANOTE 信 


第 九 步 : 在 D2 单元 格 中 输入 公式 “=VLOOKUP(C2,data,3,FALSE)”， 按 Enter 键 后 向 





下 复制 公式 ， 其 结果 如 


2.26 所 示 。 





第 十 步 : 在 F2 单元 


格 中 输入 公式 “=VLOOKUP(E2,data,4,FALSE)”， 按 Enter 键 后 向 








下 复制 公式 ， 其 结果 如 





2.27 所 示 。 





EW 






































ë iij =VLOOKUP (C2, data, 3, F =VLOOKUP (E2, data, 4, FALSE) 
| B | c li r r sss 
Wm U Fe 学 万 mur. 
x 1 4 1 20-29 4 
x 2 30-39 3 2 30-39 3 FE 
,” 2 30-39 3 2 30-39 3 本 科 
x 1 20-29 3 1 20-29 3 本 科 
x= 1 20-29 2 1 20-29 2 KY 
另 2 30-39 4 2 30-39 4 研究 生 及 以 上 
k 1 20-29 2 1 20-29 2 Kt 
= 1 20-29 2 1 20-29 2 x* 
4 2 30:39. 2 2 30-39 2 <* 
x 3 40-49 3 3 LPH ` p 
= 2 30-39 3 2 30-39 3 本 科 
z 3 409 1 3 40-49 1 高 中 及 以 下 
A 3 40 49 3 3 40-49 4 7, 3 本 科 
x 1 20-29 3 1 20-29. > 本 科 
女 1 20-29 3 1 2F29 | 本 科 
s 3 40-49 4 s I 4 研究 生 及 以 上 
fd 2 30-39 1 2 SS 1 高 中 及 以 下 
a 4 50 以 上 3 4 ra ° 本 科 
x 2 30-39 3 > ` s 本 科 
3 2 38:39. 2 Ż a = 30-39 3 本 科 
4 1 20-29 3 A 20-29 3 本 科 
n 2 3039 2 NE 30-39 2 KY 
x 2 30-39 3 V 2 30-39 3 本 科 
3 2 20-39. 4 x 2 30-39 4 研究 生 及 以 上 
2 3 49-49 3 7 3 40-49 3 本 科 
x= 1 20-29 4 1 20-29 4 研究 生 及 以 上 
到 1 7 
N “r 
图 2.26 输入 公式 “=v LOOKUP > A 227 入 公式 “=VLOOKUP 
"后 的 结果 E2,data,4,FALSE)” 后 的 结果 
(C2,data,3,FALSE)， 后 的 结 X% ,data 4， 后 的 结 


A 
第 十 一 步 : 在 DAA “=V OOKUP(G2 datasFALSE)" 按 Enter 键 后 
向 下 复制 公式 ,> 其 结果 如 图 2.28 所 示 。 、- 

< 
xO 


/ 











图 2.28 输入 公式 “=VLOOKUP(G2,data,5,FALSE)” 后 的 结果 


NS 


第 十 二 步 : 在 J 单元 格 中 输入 公式 “=VLOOKUP(I2,data,6,FALSE)”， 按 Enter 键 后 向 
下 复制 公式 ， 其 结果 如 图 2.29 所 示 。 


-G f| =VLOOKUP (12, data, 6, FALSE) 




















E 
# #5 


局 人 市 ERT | 过 EEEN 
r (mm wam 

松原 

Kë 

长 春 

松原 

松原 


Ña ña Ra Ña ña Ra Ña ñu ña Ha 


H 
Y 


` 
n ia ipin in ipin in inan in le 





s 
ahes lakea bo kokale kaksla köt LAL bs ls LLL 











A 2.29 输入 公式 v<VLOOKUPU2.data E 
: 在 L2 单元 格 中 输入 公式 oo K2,data 7,FALSE)”, {ë Enter 键 后 





第 








FT J K 
EE 是 否 喝 过 啤酒 是 否 喝 过 啤酒 最 常 喝 的 品牌 8 





fa ñu ña ñu ño ña ña ño ñu dd ña Na Ña Ne No ña Na 





第 十 四 步 : 在 N2 单元 格 中 输入 公式 “=VLOOKUP(M2,data,8,FALSE)”， 按 Enter 键 后 














向 下 复制 公式 ， 其 结果 如 图 2.31 所 示 。 


=VLOOKUP (R2, data, 8, FALSE) 






















` 
A 2.31 输入 公式 “=VLOOKUP(M2,da ,8， 


第 十 五 步 : 在 Í R HAA “=vLooKi 






































向 下 复制 公式 ， 其 结 2.32 所 示 。 X 2 
ERT ACANA 9, FALSE) K -— 
I 3 L l K = "K N 0 
EE 酒 是 否 喝 过 啤酒 最 常 喝 的 品牌 景 常 唱 的 品牌 购买 地 点 购买 地 点 饮用 量 (cC 

1 是 1 KORA 1 大 型 超市 4 

/ 1 是 2 SRE 4 2000CCBA 上 
1 * 2 2 专卖 店 3 1000-2000CC 
ï 是 g 2 专卖 店 2 500 一 一 999CC 
是 4 s 小 于 部 3 1000-2000CC 
1 是 1 1 大 型 超市 4 2000CCB 上 ， 
1 是 z 3 ARE ri 500 一 一 999CC 
1 是 2 2 SRE 2 500 一 一 999CC 
是 z z 专卖 让 4 2000ccBL 上 
是 n 2 $E 3 1000-2000CC 
1 是 2 3 小 过 部 2 500 一 一 999CC 
是 2 s ARS 3 1000-2000CC 
1 是 2 2 SRE 4 2oooccel E 
1 是 3 3 bR 1 500CCB 下 
是 1 1 大 型 超市 3 1000-2000CC 
1 是 2 2 专卖 店 4 2000CC 以 上 
是 2 3 ARE 4 2000cc 以 上 
是 3 3 Nt 1 500CCB 下 
是 2 3 ARE (I S00CCDLT 
1 是 3 1 大 型 超市 4 2000cCc 以 上 
是 2 2 SRE 4 2000Cc 以 上 
í 是 1 大 型 超市 4 2000cc 以 上 
1 是 2 s ET] 1 500CCD 下 
是 1 1 大 型 超市 4 2000cc E 
1 是 4 3 ÞES 4 2000CCB 上 
1 是 2 2 考 卖 后 3 1000-2000CC 








图 2.32 输入 公式 “=VLOOKUP(O2,data,9,FALSE)” 后 的 结果 


SSE 


第 十 六 步 : 在 R2 单元 格 中 输入 公式 “=VLOOKUP(Q2,data,10,FALSE)”， 按 Enter 键 后 
向 下 复制 公式 ， 其 结果 如 图 2.33 所 示 。 



























z, Q 
RAE ccc) 增加 气氛 
zooocceL E 
2000cc E 
1000-20000 
500 一 一 999cC 
1000-20000C 
2000ccB 上 
500——999cc 
500——999cc 
2000ccBL 上 
1000-2000cc 
500 一 一 999CC 
1000-2000CC 
2000CCELL 
500CC 以 下 
1000-2000cc 
2000CCB 上 
2000CCEI 上 
500CCB 下 
500CC 以 下 


图 2.33 输入 公式 VÈOOKUP(O2,data,10, PÁLS ”后 的 结果 


第 十 七 步 : 在 T2 单元 格 囊 输入 公式 “ios diao LsE)’ 按 Enter 键 后 
结果 如 图 2.34 所 示 。 d 








=VLOOKUP (S2, da: 
E. gi = 
BAEC 
2000cCBL 上 Z | 


2oo0cceLE 
1000-2000cC 
500 一 一 999CC 
1000-2000cc 
2000ccBL 上 
500 一 一 999cC 
500 一 一 999CC 
2000ccB 上 
1000-2000cCC 
500 一 一 999CC 
1000-2000CC 
2000cCCBL 上 
5000CBAF 
1000-2000cC 
2000cCBL 上 
2000cCCEL 上 
500cC 以 下 
5000c F 
2000ccEL 
2000CCBL 上 
2000c5 以 上 
500cC 以 下 
2000CCB 上 、 
2000ccEL 上 


2.34 ”输入 公式 “=VLOOKUP(S2,data,10,FALSE)” 后 的 结果 


BW 





第 十 八 步 : 在 V2 单元 格 中 输入 公式 “=VLOOKUP(U2,data,10,FALSE)”， 按 Enter 键 后 
向 下 复制 公式 ， 其 结果 如 图 2.35 所 示 。 


























f L, RU 
N 
m 2.35 maade a Š 后 的 结果 
第 十 九 步 : 在 X2 单元 格 中 输入 公式 “=VLOOKUP(W244 ta,10,FALSE)”， 按 Enter 键 
后 向 下 复制 公式 ， 其 结果 如 图 2.36 所 示 。 x L 








CR | 


图 2.36 输入 公式 “=VLOOKUP(W2,data,10,FALSE)” 后 的 结果 


SSE 


第 二 十 步 : 在 Z2 单元 格 中 输入 公式 “=VLOOKUP(Y2,data,10,FALSE)”， 按 Enter 键 后 
向 下 复制 公式 ， 其 结果 如 图 2.37 所 示 。 


[S fal =VLOOKUP (Y2, data, 10, FALSE) 


























5 非常 同意 
3 中 立 





` y 
图 2.37 RAAR“ LOOKUP(Y2,data,10,FALS 六 后 的 结果 


第 二 十 一 步 ， 在 `.AB 单元 格 中 输入 公式 “-VUOOKUP(AA ata LFALSE)” 按 Enter 
键 后 向 下 复制 公式 , 其 结果 如 图 2.38 所 示 。 S 


AO 








是 
是 
是 
是 
= 
是 
是 
是 
是 
是 
是 
= 
是 
是 
是 
是 
是 
是 
是 
是 
是 
是 
是 
是 
是 








图 2.38 输入 公式 “=VLOOKUP(AA,data,11,FALSE)” 后 的 结果 


= 





第 二 十 二 步 : 在 “编码 设置 ”工作 表 后 面 插入 一 个 新 的 工作 表 ， 命 名 为 “调查 结果 数 
HE”, 在 A 列 上 输入 “序号 ” 然后 切换 到 “自动 统计 调查 结果 ”工作 表 ， 按 住 Ctrl 键 ， 
依次 单 击 B、D、F、H、 J. L. N. P. R. T. V. X. Z. AB 列 ， 选 中 替换 后 的 调查 结果 ， 
如 图 2.39 所 示 。 然 后 右 击 ， 在 弹出 的 快捷 菜单 中 选择 “复制 ”选项 将 结果 复制 到 “调查 结 
果 数 据 库 ” 工 作 表 中 。 选 中 B1 单元 格 进行 粘贴 ， 其 结果 如 图 2.40 所 示 。 





















































人 CE 人 

性 出。 M FeO Fh 学 历 学 历 Et ite E 

2 = 1 20-29 4 研究 生 及 以 上 2 w 1 * 
1 z 2 30-39 3 本 科 3 Fui 1 是 
1 x 2 30-39 3 +H 1 长 各 1 是 
2 x 1 20-29 š 本 科 1 < 1 是 
2 女 1 2029 z ** 3 松原 1 是 
1 z 2 30-39 4 本 及 B 上 3 uR 1 是 
p3 x 1 20-29 2 大 专 2 a 1 是 
2 x 1 20-29 2 大 专 1 长 春 iy 是 
1 B 站 30-39 2 大 专 1 长 春 1 是 
1 x 3 a9 3 pS 2 w 1 是 
2 r 3 2 30-39 3 本 科 1 x= 1 > * 
1 . F 0-49 1 责 中 及 以 下 3 C) 是 
1 x 3 0-49 3 本 科 č 1 * 
2 x 1 20-29 3 本 科 2 1 是 
2 x Ti 20-29 3 +H 3 1 是 
1 EJ 3 4049 4 FRERE 1 l * 
1 x 2 1 a 2, * 
1 男 “ s; 1 * 
2 oe 2 3 上 是 
1 x 2 3 是 
1 B 1 3 是 
1 EJ 2 2 是 
2 x 2 3 是 
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KE 是 RE 。 500 一 一 999CC 
20-29% 松原 是 2 A&S 。 1000-20000C 3 
3039 以 上 松原 是 啤酒 大 型 超市 ”2000cC 以 上 d 
吉林 
** 
长 春 
L; 








20-29 ** 4 a Pem ARA 。 500 一 一 999CC 
og 大 学 Bon SRE 500 一 一 999CC 3 
39 大 学 `: > Eom SRE — 2000CCBA 上 对 
= 本 科 s `: KOSA YRA 1000-2000cC J 
— 30-39 本 科 EF 是 Ean ARI 500 一 一 999CC 
40-49 高 中 及 以 下 LC 是 Ean 小 卖 部 1000-20000 i 
是 Basn SRE oock i 
是 雪花 啤酒 ARE 500CC 以 下 
是 青岛 啤酒 大 型 超市 ”1000-2000cC d 
是 Boen 专卖 店 2000CC 以 上 
是 Eoen ARa  2ooocchk 3 
是 雪花 啤酒 ARS 500CC& 下 
是 Ean ARE 500CC& 下 
是 雪花 啤酒 — 大 型 起 市 。 2000CC 以 上 d 
是 蓝 钊 嘿 酒 SRE oock i 
是 ASen 大 型 超 市 ”2000CCBI 上 3 
是 Boren 小 和 部 。 500CC 以 下 
是 青岛 啤酒 “大 型 超市 ”2000CC 以 上 dl 
是 2000cC 以 上 d 
是 


1000-2000CC 


图 2.40 ”粘贴 后 的 结果 


习 题 


一 、 填 空 题 


L 从 使 用 者 的 角度 看 ， 统 计数 据 的 主要 来 源 包 括 ( 。) 和 ( 。) 两 种 渠道 。 
2. 某 研究 人 员 从 公开 的 出 版 《中 国 统计 年 鉴 》 《中 国 社会 统计 年 鉴 》 获 得 数据 ， 这 是 ( BOB. 


NS 
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3. 调查 数据 常用 的 搜集 方式 有 ( M )- 

4. 抽样 调查 具有 ( 。)、( DCO MO  ) 的 特点 。 

5. 抽样 调查 的 方式 有 很 多 ， 可 以 将 这 些 不 同 的 方式 分 为 两 类 ， 即 ( C  )。 
6. 统计 数据 的 误差 主要 包括 ( 。 ) 和 ( e 


二 、 选 择 题 
1. 我 国 第 五 次 人 口 普 查 ， 是 为 了 了 解 2000 年 11 月 1 日 零 时 人 口 的 状况 ， 某 地 区 要 求 将 调查 单位 资 
料 于 2000 年 11 月 20 日 前 登记 完毕 ， 则 普查 的 标准 时 间 是 ( — )。 
A，2000 年 11 月 20 日 零 时 B. 2000 #E 11 H 19 H 24 if 
C，2000 年 11 月 1 日 24 时 D.，2000 年 10 月 30 日 24 时 
2. 为 了 了 解 全 国 钢铁 企业 生产 的 基本 情况 ， 可 对 首钢 、 宝 钢 、 a 这 种 





























调查 方式 是 ( 。 )。 


A. 非 全 面 调查 B. 典型 调查 N 
C. 重点 抽查 D. 抽样 调查 4 "O 
3.“ 你 通常 什么 时 候 看 电视 ? ”此 问题 属于 ( 。 )。 y RN 
A. 事实 性 问题 B. 假设 性 问题 q- 
C. 容 困 性 问题 D. sa 
当 需 要 把 数值 显示 转换 为 具体 内 容 时 ， e 常 使 用 的 函数 是 ( — ). 
A. SUM() Yn 
C. COUNTIF() `D: Pn < 
XS x 
三 、 简 答题 MVN i 
1. 简 述 问卷 设计 的 原则 <“- Ç | 
2. e 
> 





BW 


= =m ”统计 数据 的 整理 与 图 形 展示 


未 


. 掌握 定性 数据 的 整理 方法 和 图 形 展示 . 
. 掌握 定量 数据 的 整理 方法 和 图 形 展示 . 
.了 解 合理 使 用 统计 图 表 。 

. 掌握 数据 的 整理 和 图 示 展 示 的 软件 操作 。 


A) 
XUE R 2 BEN 33848 A 3 EREA A 


在 某 大 学 随机 抽取 30 FENMEN. KERE 平均 月 生活 费 支出 、 平 均 每 月 购买 衣 
物 时 所 考虑 的 首要 因素 等 从 得 到 的 数据 见 表 3-1 所 示 。 
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表 3-1 平均 每 月 消费 结构 的 分 析 表 






买 衣物 首选 因素 













大 型 城市 800 












2 + 小 城市 
3 男 大 型 城市 品牌 
4 | 男 乡镇 地 区 


价格 








小 城市 


数据 收集 后 ， 如 果 不 对 数据 进行 整理 ， 是 无 法 得 出 数据 的 规律 性 的 。 利 用 本 章 将 要 讲 到 的 数据 整理 方 
法 (利用 Excel 统计 软件 建立 一 个 数据 透视 表 ， 其 中 ， 建 立 数据 透视 表 的 步骤 详 看 3.4 节 的 内 容 )， 可 以 轻 
易 得 出 本 次 调查 的 分 析 结果 ， 见 表 3-2 所 示 。 





grs (Q megaa TTT 


表 3-2 调查 分 析 结果 























































































家 庭 所 在 地 
性 别 | 买 衣服 首选 因素 数据 乡镇 地 区 | 中 小 城市 | 总 计 
价格 求 和 项 : 生活 费 / 元 1 800 400 3300 
求 和 项 : 9 衣物 支出 /元 180 40 450 
ar 求 和 项 : 物 支 出 /元 3000 3 500 
2 BR /元 800 950 
品牌 800 1 600 3 400 
a 240 480 1020 
男 求 和 项 : 平 2600 5000 10 200 
男 RAH: 420 1320 2420 
400_ 2600 3700 
价格 120 465 815 
' t-t ` 1100 3200 
£ = 330 930 
品牌 
女 求 和 项 : 平均 
女 求 和 项 : 
从 本 章 开篇 的 案例 可 知 ， 对 数据 进行 分 析 ,, 需要 先 对 数据 进行 必要 的 整理 , 例如， 对 数据 制作 频数 分 
布 表 、 用 图 形 进 行 展示 等 ， 以 发 现 数据 中 的 所 些 基 本 特征 , 为 进一步 分 析 提供 思路 。 在 对 数据 进行 整理 时 ， 


首先 要 弄 清 楚 所 面 对 的 是 什么 类 型 的 数据 ， 因 为 不同 类 型 的 数据 所 采取 的 处 理 方法 是 不 同 的 。 

为 了 对 数据 进行 分 析 ， 需 要 光 对 数据 进行 必要 的 整理 例如、 对 数据 制作 频数 分 布 表 、 
图 形 进行 展示 等 ， 以 发 现 数据 中 的 一 些 基本 特征 , -为 进一步 分 析 提供 思路 。 在 对 数据 进 
行 整 理 时 ， 首 先 要 和 弄 清楚 所 面 对 的 是 什么 类 型 的 数据 X 因为 不 同类 型 的 数据 所 采取 的 处 理 
方法 是 不 同 的 。 


























3.1 定性 数据 的 整理 与 图 形 展示 


3.1.1 定性 数据 的 整理 


根据 前 面 的 介绍 ， 定 性 数据 包括 分 类 数据 和 顺序 数据 两 种 。 对 于 定性 数据 的 整理 通常 

频数 分 布 表 。 

定义 3.1 落 在 某 一 特定 类 别 ( 或 组 ) 中 的 数据 个 数 ， 称 为 频数 。 

定义 3.2 数据 在 各 类 别 (或 组 ) 中 的 分 配 以 表格 形式 展示 ， 称 为 频数 分 布 表 。 

通常 在 频数 分 布 表 中 加 入 一 列 百分比 ， 用 百分比 来 反映 样本 (或 总 体 ) 的 构成 或 结构 。 

定义 3.3 一 个 样本 (或 总 体 ) 中 各 个 部 分 的 数据 与 全 部 数据 之 比 ， 称 为 比例 。 

定义 3.4 将 比例 乘 以 100 得 到 的 数值 称 为 百分比 或 百分数 ， 用 % 表 示 。 

百分比 是 一 个 更 为 标准 化 的 数值 ， 很 多 相对 数 都 用 百分比 表示 ， 当 分 子 的 数值 很 小 而 

分 母 数 值 很 大 时 ， 也 可 以 用 千 分 数 (‰%o) 来 表示 比例 ， 如 人 口 的 出 生 率 、 死 亡 率 、 自 然 增 长 

率 等 都 用 千 分 数 来 表示 。 
例如 , 一 家 饮料 公司 为 研究 自己 产品 的 市 场 占有 率 , 对 随机 抽取 的 一 家 超市 进行 调查 。 

调查 员 在 某 天 对 50 名 顾客 购买 饮料 的 品牌 进行 了 记录 ， 如果 顾客 购买 某 一 品牌 的 饮料 ,就 


PE 








使 用 
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将 这 一 饮料 的 品牌 名 字 记 录 一 次 。 最 后 得 到 的 数据 : 购买 可 口 可 乐 的 顾客 有 15 人 ， 购 买 旭 
日 升 冰 茶 的 顾客 有 11 人 ， 购 买 百事 可 乐 的 顾客 有 9 人 ， 购 买 汇源 果汁 的 顾客 有 6 人 ， 购 买 
露 露 的 顾客 有 9 人 。 这 是 一 组 分 类 数据 ， 用 频数 分 布 表 来 整理 ， 整 理 结果 见 表 3-3 所 示 。 


表 3-3 不 同 饮料 的 频数 分 布 表 


























饮料 名 称 百分比 /(%) 
可 口 可 乐 30 
旭日 升 冰 茶 22 
百事 可 乐 18 
汇源 果 六 12 
É: 18 
合计 100 











通常 用 Excel 中 的 数据 透视 表 来 制作 频数 分 布 表 , 操作 过 程 将 在 本 章 3.4 节 案 例 中 详细 


3.1.2 ”定性 数据 的 图 形 展示 

如 果 用 图 形 来 显示 频数 分 布 ， 就 会 更 为 服 象 和 直观 。 - 张 好 的 统计 图 表 ， 往 往 胜 过 元 
长 的 文字 表述 。 统 计 图 的 类 型 有 很 多 除了 可 以 绘制 二 维 平面 图 外 ， 还 可 以 绘制 三 维 立 体 
图 。 图 形 的 制作 均 可 由 计算 机 来 完成 % i 

定性 数据 的 图 示 方 法 包括 条 形 图 、 帕 累 托 图 、 对 比 条 形 图 饼 图 等 ， 如 果 有 两 个 总 体 
或 两 个 样本 的 分 类 相同 且 问 题 可 比 时 ， 还 可 以 绘制 环形 图 。 

1. 条 形 图 I 

定义 3.5” 用 宽度 相同 的 条 形 , 用 条 形 的 高 度 或 长 短 来 表示 数据 频数 多 少 的 图 形 , 称 为 
条 形 图 。 J 

例如 , / 表 3-3 不 同 品牌 饮料 频数 分 布 的 条 形 图 如 图 3.1 所 示 。 


| 日 频数 
4 


3.1 不 同 品牌 饮料 频数 分 布 的 条 形 图 
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2. 帕 累 托 图 


帕 累 托 图 是 以 意大利 经 济 学 家 帕 累 托 (Pareto) 的 名 字 来 命名 的 。 它 也 是 条 形 图 的 一 种 特 
征 情 况 。 
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定义 3.6 按 各 类 别 数据 出 现 的 频数 多 少 经 排序 后 绘制 的 条 形 图 ， 称 为 帕 累 托 图 。 




















通过 对 条 形 图 的 排序 ， 可 以 很 容易 地 看 出 哪 类 数据 出 现 得 多 ， 哪 类 数据 出 现 得 少 。 
表 3-3 不 同 品牌 饮料 频数 分 布 的 帕 累 托 图 如 图 3.2 所 示 。 
频数 
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图 3.2 不 同 品牌 饮料 频数 分 布 monn 
3. 对 比 条 形 图 


T 为 对 比分 类 变量 的 取 值 ， 可 以 绘 
制 对 比 条 形 图 ， 了 解数 据 在 不 同时 间或 不 同 的 差异 或 变化 趋势 。 


例如 ， 本 月 与 上 月 的 不 同 品 Wt a 朋 查 结果 见 表 3-4 所 示 。 


不 同 品牌 饮料 频数 让 场 调查 数据 





























“ 
利用 Excel 制作 对 比 条 形 图 ， 如 图 3.3 所 示 。 
16 
14 F 
12 F 
Bd — 国 本 月 
国 上 月 
6 Ë 
4 Ë 
2 Ë 
Ú i i i i 
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图 3.3 本 月 与 上 月 不 同 品牌 饮料 的 市 场 占 有 率 对 比 
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4. 饼 图 
定义 3.7 用 圆 形 及 圆 内 扇形 的 角度 来 表示 数值 大 小 的 图 形 , 称 为 饼 图 。 它 主要 用 于 表 
示 一 个 样本 (或 总 体 ) 中 各 组 部 分 的 数据 占 全 部 数据 的 比例 。 
饼 图 对 于 研究 结构 性 问题 十 分 有 用 。 在 绘制 饼 图 时 ， 样 本 中 各 部 分 所 占 的 百分比 可 
内 的 各 个 扇形 角度 表示 ， 即 扇形 的 中 心 角度 ， 是 按 各 部 分 所 占 圆 周 的 相应 比例 确定 的 。 
例如 ， 表 3-3 不 同 品牌 饮料 频数 分 布 的 饼 图 如 图 3.4 所 示 。 
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图 3.4 s= asenon 
3. 2 zanm SEKR 


3.1 节 介 绍 的 定 mE aN T PPY 5 显示 。 除 此 之 
外 ， 玫 信 妆 据 还 存 一 此 特定 的 整理 和 图 示 方 法 、 公 它们 并 不 适用 于 分 类 数据 和 谢 序 数据 

a ik, k” SB 对 于 不 同 整理 的 方式 有 不 同 的 图 
ERREN 、 


3.2 en 
对 于 未 分 组 的 定量 数据 的 整理 ， 通 常 是 对 其 进行 简单 的 排序 ， 通 过 对 数据 的 排序 ， 找 


























出 数据 的 规律 性 。 未 分 组 的 数据 通常 用 茎 叶 图 和 箱 线 图 来 展示 。 
1. #4 
定义 3.8 H “2” A “nr” ARDA, KARRAR, KIER. 
EIR R” # e” RAR HRE EAFA. E, AE 


























出 数据 的 分 布 形状 及 数据 的 离散 状 况 ， 如 分 布 是 否 对 称 、 数 据 是 否 集中 、 是 否 是 离 群 点 等 。 
绘制 茎 叶 图 的 关键 是 设计 好 树 茎 。 设 计 思 路 : 树 茎 上 长 很 多 树叶 , 所 以 lz15567 
设计 树 芭 时， 要 找 出 未 分 组 数据 的 共同 点 为 树 茎 ， 不 同 的 为 树叶 。 

例如 ，125、125、126、127、135、136、147、148 这 组 数据 ， 可 以 
茎 叶 图 表示 ， 如 图 3.5 所 示 。 14|78 
茎 叶 图 具有 的 特点 : 保留 了 原始 数据 的 信息 ， 通 常 适用 于 小 批量 数据 。 图 3.5 SHE 
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2. 箱 线 图 


定义 3.9 由 一 组 数据 的 最 大 值 、 最 小 值 、 中 位 数 和 两 个 四 分 位 数 5 个 特征 值 绘制 而 成 
的 、 反 映 原始 数据 分 布 的 图 形 ， 称 为 箱 线 图 。 

其 中 中 位 数 和 四 分 位 数 将 在 第 4 章 学 习 , 所 以 这 里 只 是 简单 介绍 一 下 箱 线 图 如 何 制作 。 

箱 线 图 由 一 个 箱子 和 两 条 线段 组 成 ， 如 图 3.6 所 示 。 其 中 左 侧线 段 的 起 点 由 一 组 数据 
的 最 小 值 决定 ， 右 侧线 段 的 终点 由 这 组 数据 的 最 大 值 决定 ， 箱 子 的 左边 和 右边 分 别 由 这 组 
数据 的 上 下 四 分 位 数 决 定 ， 箱 子 的 里 面 有 这 组 数据 的 中 位 数 。 

数据 利用 箱 线 图 如 何 找 出 数据 的 规律 性 呢 ? 简单 来 看 一 个 例子 : 

例如 从 某 大 学 经 济 学 专业 某 一 年 级 中 随机 抽取 3 名 学 生 ，3 名 学 生 的 这 学 期 所 有 课程 
的 成 绩 如 下 : 1% 
张 小 1: 英语 76 分 ;经 济 数学 65 分 ， 西 方 经 济 学 N 销 学 74 分 ; 会 计 学 
后 分 政法 经 济 学 70 分， 统计 学 5 分 :计算 机 应 用 六 矶 83 

赵 华 2， 英语 90 分 ， 经 济 数学 95 分 ; a) 市 场 营销 学 87 分 ; 会 计 学 
人 分， 政法 和 济 学 分 ， 统计 学 91 分 计算 机 了 四 础 78 分 ; 

王 英 3: 英语 97 分 ， 经 济 数学 51 分 ， 西 六 va 市 场 营 销 学 85 分 ; 会 计 学 
70 分 ; 政法 经 济 学 92 分 ， 统计 学 68 2): 计 应 用 基础 81 分 ; 

根据 中 位 数 和 上 下 四 分 位 数 的 公 VÝ * 生 的 箱 线 图 ， 如 图 3.7 所 示 。 
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图 3.6 箱 线 图 图 3.7 三 名 学 生成 绩 的 箱 线 图 


从 图 3.7 可 以 看 出 , 在 3 名 学 生 中 , 第 2 号 学 生 ( 赵 华 ) 各 科 的 平均 考试 成 绩 最 高 ， 而 
各 学 科 成 绩 之 间 的 离散 程度 也 较 小 ， 而 第 1 号 学 生 张 小 的 平均 考试 成 绩 最 低 ， TAANE 
试 成 绩 的 离散 程度 也 较 大 ， 各 科 考 试 成 绩 之 间 离散 程度 最 大 的 是 第 3 号 学 生 王 英 。 
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1. 定量 数据 的 分 组 

对 数值 数据 进行 整理 的 另 一 种 方法 ， 通 常 是 对 其 进行 分 组 。 数 据 分 组 的 主要 目的 是 观 
察 数据 的 分 布 特征 。 

定义 3.10 根据 统计 研究 的 需要 ， 将 原始 数据 按照 某 种 标准 分 成 不 同 的 组 别 ， 称 为 数 
据 分 组 。 
其 中 ， 分 组 后 的 数据 称 为 分 组 数据 。 数 据 经 分 组 后 再 计算 出 各 组 中 数据 出 现 的 频数 
就 形成 了 一 张 频数 分 布 表 。 这 里 的 分 组 是 指 组 距 分 组 。 
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定义 3.11 将 全 部 变量 值 依次 划分 为 若干 个 区 间 ， 并 将 这 一 区 间 的 变量 值 作为 一 组 ， 
称 为 组 距 分 组 。 其 中 组 距 分 组 又 分 为 等 距 分 组 和 不 等 距 分 组 。 
定义 3.12 各 组 组 距 相等 的 组 距 分 组 ， 称 为 等 距 分 组 。 
例如 ，60 一 69 分 为 及 格 ; 70 一 79 分 为 中 等 ; 80 一 89 分 为 良好 ， 这 是 一 个 等 距 分 组 。 
定义 3.13 各 组 组 距 不 相等 的 组 距 分 组 ， 称 为 不 等 距 分 组 。 
如 ， 对 人 口 年 龄 的 分 组 ， 可 根据 人 口 成 才 的 生理 特定 分 成 0 一 6 岁 ( 婴 幼 儿 组 )、7 一 17 
岁 (少年 儿童 组 )、18 一 59 岁 (中 青年 组 )、60 岁 以 上 (老年 组 ) 等 。 
为 了 让 学 生 更 好 地 掌握 数值 数据 分 组 的 过 程 ， 这 里 以 例题 的 形式 讲解 如 何 进 行 分 组 ， 
这 里 分 组 采用 的 是 等 距 分 组 。 
【 例 3.1] 长 春 市 某 年 1 一 2 月 各 天 气温 的 记录 数据 见 表 3-5 所 示 , ,对 下 面 的 数据 进行 适 
当 的 分 组 。 ° 
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表 3-5 ”长春 市 某 年 1~2 月 各 天 气温 、 du; C 





定义 3.14 EEDA, ANER REMERA FIR; — A 00 KARSPKOUS ER o 
下 面 ， 结 合 例 3.1 说 明 分 组 的 过 程 和 频数 分 布 表 的 编制 过 程 。 
(1) 对 数据 进行 排序 , “排序 后 可 得 表 3-6。 


表 3-6 长 春 市 某 年 1%-2) 月 各 天 气温 排序 单位 : C 
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(2) 确定 组 数 。 确 定 组 数 是 指 将 这 组 数据 分 成 多 少 组 。 确 定 组 数 的 规则 条 件 有 3 个 : 
© 一 般 情况 下 , 一 组 数据 所 分 的 组 数 天 不 应 少 于 5 组 且 不 多 于 15 组 , BBS < K S 15. 











© 用 斯 特 奇 斯 (Surges) 提 出 的 经 验 公式 来 确定 组 数 K: 
Ke EE G.) 





AP, n 为 数据 的 个 数 。 
对 所 得 结果 四 舍 五 入 取 整 数 即 为 组 数 ， 则 例 3.1 有 K=1+lg60 垃 lg2 守 7， 即 应 分 为 7 组 。 
当然 ， 这 只 是 一 个 经 验 公式 。 
© 灵活 确定 组 数 。 在 实际 应 用 中 ， 可 根据 数据 的 多 少 和 特点 及 分 析 的 要 求 ， 参 考 以 上 
两 条 灵活 确定 组 数 。 由 于 这 组 数据 不 多 ， 因 此 该 例 确定 为 K=5 组 。 
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(3) 确定 各 组 的 组 距 。 
定义 3.15 一 个 组 的 上 限 与 下 限 的 差 ， 称 为 组 距 。 
组 距 可 根据 全 部 数据 的 最 大 值 和 最 小 值 及 所 分 的 组 数 来 确定 ， 即 
组 距 =( 最 大 值 一 最 小 值 )/ 组 数 (3.2) 
在 例 3.1 中 ， 最 大 值 为 9， 最 小 值 为 -32， 则 组 距 =(9+32)/5=8.2。 为 便于 计算 ,组 距 宜 
取 5 或 10 的 倍数 ， 因 此 组 距 可 取 10. 
(4) 分 组 并 制作 频数 分 布 表 。 
采用 组 距 分 组 时 ， 需 要 遵循 “不 重 不 漏 ” 的 原则 。“ 不 重 ” 是 指 一 项 数据 只 能 分 在 其 中 
的 某 一 组 ， 不 能 在 其 他 组 中 重复 出 现 ;“ 不 漏 ” 是 指 组 别 能 够 包含 所 有 数据 ， 即 在 所 分 的 全 
部 组 别 中 ， 每 项 数据 都 能 分 在 其 中 的 某 一 组 ， 不 能 遗漏 。 为 了 解决 “不 漏 ?”， 所 以 第 一 组 的 
下 限 应 低 于 最 小 变量 值 ， 最 后 一 组 的 上 限 应 高 于 最 大 变量 值 。 即 第 一 组 的 下 限 就 低 于 -32， 
最 后 一 组 的 上 限 应 高 于 9。 解决 “不 重 ” 的 问题 ， 统计 分 组 时 习惯 上 规 完 “ 上 组 限 不 在 内 ”， 
即 当 相 邻 两 组 的 上 下 限 重 营 时， 恰好 等 于 某 一 组 上 限 的 变量 值 涉 算 在 本 组 内 ， 而 计算 在 下 
一 组 内 。“ 不 重 不 漏 ” 数学 语言 来 表示 就 是 分 组 后 的 变量 值 满足 a < x<b。 根 据 以 上 的 
原理 ， 得 出 例 3.1 的 分 组 后 的 频数 分 布 表 ， 见 表 3- 1 六 


R37 长春 市 某 年 1 一 2 月 和 法 认 组 后 的 上 分布 
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按 气温 分 组 /C 频数 /(%) 
-40 一 -30 L7 
-30 一 -20 N 10 
-20~-10 TE 30 
-10~0 412 
0~10 A 16.6 
合计 | 100 





MIRA ANEKTA naspa fto, Os 反映 各 组 数据 的 一 般 水 平 ， 通 常用 组 中 什 
作为 该 组 数据 的 一 个 代表 值 。 | 

定义 3.16 每 一 组 的 下 限 和 上 限 之 间 的 中 点 值 ， 称 为 组 中 值 ， 即 组 中 值 =( 下 限 值 十 上 
限 值 )/2。 

使 用 组 中 值 代表 一 组 数据 时 有 一 个 必要 的 假定 条 件 ， 即 各 组 数据 在 本 组 内 呈 均 匀 分 布 
或 在 组 中 两 侧 呈 对 称 分 布 。 如 果实 际 数据 的 分 布 不 符合 这 一 假定 ， 那 么 用 组 中 值 作为 一 组 
数据 的 代表 值 会 有 一 定 的 误差 。 
2. 分 组 数据 的 图 形 展示 一 直方 图 


通过 数据 分 组 后 形成 的 频数 分 布 表 ， 可 以 初步 看 出 数据 分 布 的 一 些 特征 和 规律 。 如 果 
形 来 表示 这 一 分 布 的 结果 ， 就 会 更 为 形象 、 直 观 。 
通常 使 用 直方 图 、 折 线 图 和 曲线 图 来 显示 分 组 数据 的 频数 分 布 特征 ， 这 里 主要 介绍 直 
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定义 3.17 用 和 矩形 的 宽度 和 高 度 ( 即 面积 ) 来 表示 频数 分 布 的 图 形 ， 称 为 直方 图 。 
在 平面 直角 坐标 中 ， 用 横 轴 表示 数据 分 组 ， 用 纵 轴 表示 频数 或 频率 ， 那 么 各 组 与 相应 
的 频数 就 形成 了 一 个 矩形 ， 即 直方 图 。 表 3-7 的 直方 图 如 图 3.8 所 示 。 
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图 3.8 长春 市 某 年 1 一 2 月 各 天 气温 ('C) 的 直方 图 

从 图 3.8 可 以 直观 地 看 出 ， 对 于 温度 的 分 布 来 说 ,| 其 左边 的 尾部 比 右边 的 尾部 长 一 些 ， 
略微 有 一 些 左 偏 分 布 。 

直方 图 与 条 形 图 不 同 有 以 下 3 点 : 

(1) 条 形 图 是 用 条 形 的 宽度 相同 , ` 儿 条 形 的 长 度 表示 各 类 别 频数 的 多 少 ， 而 直方 图 则 
是 用 面积 表示 各 类 别 频数 的 多 少 。 

(2) 从 图 3.2 和 图 3.8 中 可 以 看 出 ， 直 方 图 的 各 和 矩形 通常 是 连续 排列 ， 而 条 形 图 则 是 分 
开 排 列 。 

(3) 条 形 图 主要 用 于 展示 分 类 数据 ， 而 直方 图 则 主要 用 于 展示 数值 数据 。 

3. 时 间 序 列 数据 的 图 形 展示 

如 果 数 值 数 据 是 在 不 同时 间 上 取得 的 ， 即 时 间 序 列 数据 ， 则 可 以 绘制 线 图 。 

定义 3'18 线 图 是 在 平面 坐标 上 用 折线 表现 数据 变化 特征 的 图 形 。 时 间 一 般 绘 在 横 轴 ， 
观测 值 绘 在 纵 轴 。 

线 图 主要 用 于 显示 时 间 序 列 数据 ， 以 反映 事物 发 展 变化 的 规律 和 趋势 。 

【 例 3.2] 已 知 2000—2011 年 我 国 城乡 居民 家 庭 的 人 均 收 入 数据 见 表 3-8 所 示 ， 试 通 
过 绘制 线 图 来 看 我 国 城镇 居民 的 家 庭 的 人 均 收 入 发 展 变化 。 

表 3-8 2000—2011 年 城乡 居民 家 庭 人 均 收 入 















































单位 ; 元 
年 份 城镇 居民 农村 居民 
2000 6280.0 2 253.4 
2001 6859.6 | 2 366.4 
2002 7702.8 | 2 475.6 
2003 8472.2 | 2 622.2 
2004 9 061.22 | 3 582.42 
2005 10 128.51 | 4 039.60 
2006 11 320.77 4631.21 
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续 表 
年 份 城镇 居民 农村 居民 
2007 12719.19 5 025.08 
2008 14 908.61 5791.12 
2009 17 067.78 6 700.69 
2010 18 858.09 7115.57 
2011 21033.42 8119.51 
解 : 绘制 线 图 通常 使 用 Excel 软件 来 绘制 ， 如 图 3.9 所 示 。 
25000 
20000 F 
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3.9 “2000 一 201i 征 城乡 居民 家 庭 人 均 收入 线 图 
从 图 3.9 中 可 以 清楚 地 看 出 ,城乡 居民 的 家 庭 人 均 收 从 过 年 提高 ， 而 且 城 镇 居民 的 家 


庭 人 均 收 入 高 于 农村 。 此 和 处， H 2005 年 后 这 种 差 距 有 扩 KHE o 
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上 面 介绍 的 全 此 图 形 描述 的 都 是 单 变量 数据 y> 当 有 两 个 或 两 个 以 上 变量 时 ， 乔 
就 很 难 描述 了 。 为 此 ， 人 们 往 究 了 多 变量 的 图 示 方法 ， 其 中 有 散 点 图 、 三 位 散 


I 点 图 方 





(2) 三 维 散 点 图 。 当 考察 3 个 变量 之 间 的 关系 时 ， 二 维 散 上 
制 三 位 散 点 图 和 气泡 图 来 展示 3 间 的 关系 。 

(3) 雷达 图 。 雷达 图 是 显示 多 个 变量 的 常用 图 示 方 法 。 绘 制 雷 
组 样本 5,5,,…,S, ， 每 个 样本 测 得 PAER X, XX o RA 





TE 





























(1) 二 维 散 点 图 。 二 维 散 点 图 是 用 二 维 坐标 展示 两 个 变量 之 间 关系 的 一 种 图 形 。 


将 圆 己 等 分 (由 变量 的 个 数 决 定 )， 得 到 尸 个 点 ， 再 将 这 尸 个 点 与 圆心 连 线 ， 得 到 己 个 辐射 
状 的 半径 ， 这 PP 个 半径 分 别 作为 P 个 变量 的 坐标 轴 ， 每 个 变量 值 的 大 小 由 半径 上 的 点 到 辆 








- 般 











点 图 不 再 适用 ， 这 时 可 以 绘 











达 图 的 方法 如 下 : 设 有 n 
] 在 平面 先 做 一 个 圆 ， 然 后 






























































心 的 距离 表示 ， 再 将 同一 样本 的 值 在 P 个 坐标 上 的 点 连 线 。 这 样 一 来 ，7 个 样本 形成 的 n 





个 多 边 形 就 是 一 个 雷达 图 。 











3.3 统计 表 的 使 用 





统计 表 和 统计 图 是 显示 统计 数据 的 两 种 方式 。 在 日 常生 活 中 














视 、 查 阅 计算 机 网 络 时 ， 都 能 看 到 大 量 的 统计 表格 和 统计 图 形 。 
(FEW 


， 当 人 们 阅读 报刊 、 看 电 
统计 表 把 杂乱 的 数据 有 条 





统计 数据 的 整理 与 图 形 展示 ,ue 党, S 





理 地 组 织 在 一 张 简明 的 表格 内 ,统计 图 把 数据 形象 地 显示 出 来 。 本 节 将 介绍 统计 表 的 构成 。 
统计 表 一 般 由 4 个 主要 部 分 组 成 ， 即 表 头 、 行 标题 、 列 标题 和 数字 资料 。 此 外 ， 必 要 







































































时 还 可 以 在 统计 表 的 下 方 加 上 表 外 附加 。 某 城市 居民 关注 广告 类 型 的 频率 分 布 见 表 3-9 所 示 。 
表 3-9 某 城市 居民 关注 广告 类 型 的 频数 分 布 
广告 类 型 频率 
商品 广告 56.0% 
服务 广告 25.5% 
金融 广告 4.5% 
房地产 广告 8.0% 
招生 招聘 广告 5.0% 
其 他 广告 1.0% 
合计 100% 





(资料 来 源 ， 贾 俊平 . 统计 学 IN- 了 版 . 北京 : 清华 大 学 出 版 社 ，2006.) 


O) 表 头 应 放 在 表 的 上 方 ， 它 所 说 明 的 是 统 评 交 的 内 容 。 表 头 一 般 应 包括 表 号 ( 表 3-9)、 
总 标题 ( 某 城市 居民 关注 广告 类 型 的 频数 分 布 ) 和 表 中 数据 的 单位 等 内 容 。 总 标题 应 简明 确 
切 地 概括 出 统计 表 的 内 容 ， 如 果 表 中 的 全 部 数据 都 是 同一 计量 单位 ， 即 可 在 表 的 右上 角 标 
明 ， 若 各 变量 的 计量 单位 不 同 ， 则 应 放 罕 每 个 变量 后 或 单列 出 - - 列 标明 。 

(2) 行 标题 和 列 标题 通常 安排 在 统计 表 的 第 一 列 和 第 元 Ah 它 所 表示 的 主要 是 所 研究 
问题 的 类 别名 称 和 变量 名 称 s 

O 表 的 其 余部 分 是 具体 的 数字 资料 ; 表 处 附 基 通过 放 在 统计 表 的 下 方 ， 主要 包括 数 
据 来 源 、 变 量 注 释 和 必要 的 说 明 等 内 容 。 表 中 的 数据 一 般 是 右 对 齐 ， 有 小 数 点 时 应 以 小 数 
点 对 齐 ， 而 且 小 数 点 的 位 数 应 统一 。 对 于 没有 数字 的 表格 单元 ， 一 般 用 “一 ”表示 ， 一 张 
填 好 的 统计 表 不 应 出 现 空白 单元 格 。 J 

(4) 在 使 用 统计 表 时 ， 必 要 时 可 在 表 的 下 方 加 上 注释 ， 特 别 要 注 明 数据 来 源 ， 以 表示 
对 他 人 劳动 成 果 的 尊重 ， 这 样 也 能 方便 读者 查阅 使 用 。 

















34 ”案例 分 析 : 啤酒 市 场 的 调查 与 分 析 及 Excel 上 机 
应 用 一 一 样本 组 成 分 析 


3.4.1 ”性 别 结构 的 分 析 


于 抽样 调查 取得 的 样本 中 包含 男性 和 女性 ,首先 进行 性 别 组 成 分 析 ， 这 里 使 用 筛选 和 
到 表 功 能 来 进行 分 析 ， 其 具体 操作 的 过 程 如 下 。 
第 一 步 : 插入 一 个 新 的 工作 表 ， 命 名 为 “样本 组 成 分 析 ” 在 工作 表 中 创建 如 图 3.10 
所 示 的 表格 。 
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maos 样本 组 成 分 析 ” 工 作 

Lx 
第 二 步 : 切换 到 “调查 结果 数据 库 ”工作 表 中 ， 
按钮， 此 时 第 一 行 的 单元 格 中 洗 显 示 一 个 下 拉 按钮 所 
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L 
2 E 20-29 研究 生 及 以 上 是 青岛 啤酒 大 型 超市 ”2000CC 以 上 FAS 
3 男 30-39 本 科 松原 是 Eoen RE 2000cC 以 上 非常 同意 
4 m 30-39 +H 长 春 是 Eoen 专卖 店 1000-200000 非常 同意 
5 x 20-29 FH 长 春 是 Eoen SRE ”500 一 一 999CC me 
6 J 20-29 大 专 松原 是 爹 民 百 啤酒 小 卖 部 。 1000-2000CC ”非常 同意 
i 男 30-39 研究 生 及 以 上 松原 是 青岛 啤酒 大 型 超市 。 2000CC 以 上 非常 同意 
8 x 20-29 x 吉林 是 Eoen ARE 。 500 一 一 999CC 同意 
9 * 20-29 KY 长 春 是 Famn ORE soo——escc PEME 
10 男 30-39 x* 长 春 是 Eoen SRE 2000CC 以 上 非常 同意 
男 40-49 本 科 吉林 是 青岛 啤酒 RA 。 1000-2000CC 非常 同意 
2 30-39 本 科 长 春 是 Eoen ARS ”500 一 一 999CC AS 
m 40-49 高 中 及 以 下 松原 是 wapsi 小 卖 部 。 1000-2000CC ”非常 同意 
男 40-49 本 科 mu 是 Espais SRE “2000CC 以 上 非常 同意 
* 20-29 FH E 是 生花 啤酒 小 卖 部 500CCUIT 
i. 2020. Ail ra 三 S; unpu Amit oon. 2000 
图 3.11 数据 筛选 


第 三 步 : 单 击 第 一 行 中 的 “性 别 ” 所 在 单元 格 的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 


“ 男 ” 复 选 框 ， 如 图 3.12 所 示 。 





EW 


选中 第 定 行 ， 单 击 “ 数 据 ” — “Jb” 
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第 四 步 : 将 上 
所 示 。 

第 五 步 : 在 
图 ”的 下 拉 按 钮 ， 

第 六 步 : 选 


oo sm pa 
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s 是 Et 


















3.12 PRA = pa 


一 步 的 结果 填 入 在 AAA 作 表 中 的 表格 中 ， 结 果 如 图 3.13 


“样本 组 成 分 析 ” 工 人 ge prian :C5， 单 击 “ 插 入 ”一 “ 饼 
he 中 Lo 选项 ， 如 图 3.14 所 示 。 
i 系列 设置 ， IEN 图 形 如 图 3.15 所 示 。 








图 3.13 ”将 结果 填 入 表格 中 
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O 选择 “三 维 饼 图 ”选项 AS 
图 3.14 创建 三 维 饼 图 ~、 





3 并 
NO 图 3.15 数据 条 列 设置 后 的 三 维 全 图 
3.4.2 PA 的 分 析 


下 面 对 样 本 中 受 访 者 的 年 龄 结构 进行 分 析 ， 这 里 利用 数据 透视 图 表 来 进行 分 析 ， 具 体 
的 操作 过 程 如 下 。 

第 一 步 : 打开 “样本 组 成 分 析 ” 工 作 表 ， 单 击 “ 插 入 ”一 “数据 透视 表 ” 的 下 拉 按 钮 ， 
在 弹出 的 下 拉 列 表 中 选择 “数据 透视 表 ” 选 项 ,弹出 “创建 数据 透视 表 ” 对 话 框 ， 如 图 3.16 
所 示 





























选择 好 区 域 及 数据 透视 表 的 位 置 ， 如 图 3.16 所 示 ， 单 击 “ 确 定 ” 按 钮 。 

二 步 : 在 “样本 组 成 分 析 ” 工 作 表 的 右 侧 出 现 “ 数 据 透视 表 字 段 列 表 ” 任 务 窗 格 
如 图 3.17 所 示 。 

三 步 : 选中 数据 区 域 ， 单 击 “ 插 入 ”一 “ 柱 形 图 ”的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 
中 选择 “ 簇 状 柱 形 图 ”选项 ， 如 图 3.18 所 示 ， 得 到 如 图 3.19 所 示 的 结果 。 
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PP k E K 
请 选择 要 分 析 的 数据 
名 选择 一 个 表 或 区 域名 ) 
ERAD: | 调查 结果 数据 库 'SB51 SB531 


加 现 有 工作 表 允 ) 
EEO: | 样本 组 成 分析 1$B$25| ES] 
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图 3.19 结果 统计 
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一 、 填 空 题 
1. 定性 统计 数据 包括 ( AC ARRE. 
2. 对 于 定性 数据 的 整理 我 们 通常 使 用 的 是 ( 。 )。 
3. 落 在 某 一 特定 类 别 (或 组 ) 中 的 数据 个 数 ， 称 为 ( — )。 
4. 数据 在 各 类 别 (或 组 ) 中 的 分 配 以 表格 形式 展示 ， 称 为 ( — )。 
5. 用 宽度 相同 的 条 形 的 高 度 或 长 短 来 表示 数据 多 少 的 图 形 称 为 ( — )。 
6. 各 类 别 数据 出 现 的 频数 多 少 经 排序 后 绘制 的 图 形 称 为 ( 。 )。 
7 由 “ 鞋 ”和 “ 叶 ” 两 部 分 组 成 的 、 反 映 原始 数据 分 布 的 图 形 ， 称 为 RA 
8. 设计 树 茎 时 ， 对 于 未 分 组 数据 来 说 共同 点 为 (  )， 不 同 的 为 ( / < 
9. 定量 数据 的 整理 有 两 种 方法 ， 分 别 是 ( ME  ) 两 种 。 S 
10. 由 一 组 数据 的 最 大 值 、 最 小 值 、 中 位 数 和 两 个 四 分 位 ia 绘制 而 成 的 、 反 映 原始 数据 分 
布 的 图 形 ， 称 为 (  ). ÄN 
1L REMANEN, re 量 值 作为 一 组 ， 称 为 ( 。”)。 
12. 组 距 分 组 分 为 ( ) 和 ( )。 
13. 一 个 组 的 最 小 值 称 为 ( 。 ): RN ES )。 
14. 一 个 组 的 上 限 与 下 限 的 差 ， 称 为 ( O- 
15. 采用 组 距 分 组 时 ， 需 要 遵循 (、 NS N 
16. e eoar s RAPE HIES 
i7. 如 果 数 值 型 数据 是 在 不 同时 问 上 取得 的 ， 称 为 ( x 


18. 用 二 oa 992 ` XX 
19. 统计 表 一 般 由 4 个 主要 部 分 组 成 ， B Ç Pd 
头 一 般 应 包括 ( — )、( 容 。 

















20. 表 








sasa , 
L ia AEE, E 可 以 绘制 ( Je 






































A. 条 形 图 B. 帕 累 托 图 C. 饼 图 D. 对 比 条 形 图 
2. 对 于 未 分 组 的 数据 通常 用 (  ) 图 形 展示 。 
A. 条 形 图 B. mHE C. 箱 线 图 D. 直方 图 
3. 能 够 保留 原始 数据 的 信息 的 图 形 是 (。”)。 
A. 饼 图 B. 茎 叶 图 C. 箱 线 图 D. 直方 图 
4. 下 列 不 是 构成 箱 线 图 的 特征 值 的 是 ( o 
A. 最 大 值 B. 最 小 值 C. 众 数 D. 中 位 数 
5. 将 学 生成 绩 分 为 3 组 : 60 一 69 分 为 及 格 ; 70 一 79 分 为 中 等 ，80 一 89 分 为 良好 ， 这 属于 (  )。 
A. 等 距 分 组 B. 不 等 距 分 组 C. 组 距 分 组 D. 区 间 分 组 





6. 对 人 口 年 龄 的 分 组 ， 可 分 为 以 下 4 组 : 0 一 6 岁 ( 婴 幼 儿 组 )、7 一 17 岁 (少年 儿童 组 )、18 一 59 岁 (中 青 
年 组 )、60 岁 以 上 (老年 组 )， 这 种 分 组 属于 ( )o 





A. 等 距 分 组 B. 不 等 距 分 组 C. 组 距 分 组 D. 区 间 分 组 
7. 每 一 组 的 下 限 和 上 限 之 间 的 中 点 值 ， 称 为 ( 。 e 
A. 组 中 值 B. 最 小 值 C. 众 数 D. 中 位 数 
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. 显示 分 组 数据 频数 分 布 特征 的 图 形 是 ( 。 )。 
A. 条 型 图 B. ZHE C. 箱 线 图 D. 直方 图 
9. 显示 时 间 序 列 数据 ， 主 要 使 用 ( )。 
A. 条 型 图 B. HA C. RE D. 直方 
10. 考察 3 个 变量 之 间 的 关系 时 ， 下 列 不 适用 的 图 形 是 (。”)。 
A. 二 维 散 点 图 B. 三 维 散 点 区 c. 气泡 图 D. 雷达 医 
三 、 练 习题 
1. 某 银行 为 加 强 银行 F penaa SANAMA 量 设 有 5 个 等 级 供 顾客 选择 ， 分 别 为 : A 一 一 非常 满 
意 ，B 一 一 满意 ，C 一 一 一 般 ; i 上 E 常 不 满意 。 为 了 解 某 一 位 职员 服务 的 质量 ， 从 她 所 

















EN RA -个 样本 ， 调查 结果 如 表 3-10 所 示 。 
表 3-10 调查 结果 





(1) 指出 表 3-10 数据 的 类 型 。 
(2) 用 Excel 制作 一 张 频 数 分 布 表 % 
(3) 根据 表 3-10 的 数据 绘制 一 中 























2. 利用 表 3-11 所 示 的 数据 绘制 茎 叶 图 和 箱 线 图 。 

表 3-14” 调查 数据 
52 30 
25 46 
36 29 
44 15 
3. 某 大 型 超市 30 天 的 销售 额 情况 如 表 3-12 所 示 。 


表 3-12 某 大 型 超市 30 天 的 销售 额 














问题 : 
(1) 以 组 距 为 5 对 上 面 数 据 进行 等 距 分 组 ， 并 整理 成 频数 分 布 表 。 
(2) 绘制 直方 医 











4. 某 袋 装 洗 衣 液 采用 生产 线 自动 装填， 每 袋 容 量 大 约 为 S00mL， 但 由 于 某 些 原因 ， 每 袋 容量 不 会 恰 
好 是 500mL。 表 3-13 是 随机 抽取 的 100 袋 产品 的 容量 数据 。 
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表 3-13 随机 抽取 的 100 袋 产品 的 容量 数据 
























































500 516 528 485 484 505 518 519 
506 515 512 482 490 492 507 501 
508 529 494 481 506 461 535 465 
468 510 493 497 498 498 496 498 
506 492 491 527 498 500 510 522 
494 490 536 489 473 529 508 527 
488 489 483 485 498 513 486 502 
501 681 518 507 523 512 483 492 
493 497 494 481 487 479 495 491 
513 499 525 526 503 496 517 488 
问题 : 
(1) 利用 计算 机 对 表 3-13 的 数据 进行 排序 。 
(2) 以 组 距 为 10 为 表 3-13 的 数据 进行 等 距 分 组 ， 并 整理 成 频数 分 布 表 。 
(3) 绘制 频数 分 布 的 直方 图 。 
(4) 说 明 数 据 分 布 的 特征 。 
S.A. B 两 个 班 各 有 35 名 学 生 ， 期 末 经 济 学 成 绩 的 分 布 如 表 3-14 所 示 。 
表 3-1 全 学生 的 期 末 经 济 学 成 绩 分 布 
考试 成 绩 中 

优 

Ë: 10 

中 11 

及 格 6 

不 及 格 3 


问题 





(1) 根据 表 3-14 的 数据 ， 画 出 两 个 班 成 绩 的 对 比 条 形 图 和 环形 图 。 
(2) 比较 两 个 班 考试 成 绩 的 分 布 特点 。 
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6 ) 


.人 掌握 数据 集中 趋势 的 度量 。 

掌握 数据 离散 程度 的 度量 。 

.了 解数 据 的 偏 态 和 峰 态 的 度量 。 
.掌握 描述 统计 指标 的 软件 操作 过 程 。 
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哪 名 运动 员 的 发 挥 更 稳定 ? 
在 奥运 会 女子 10 米 气 手枪 比赛 中 \ 每 个 运动 员 首先 进行 每 组 ,TOi 萎 共 4 组 的 预赛 ， 然 后 根据 预赛 总 成 
绩 确定 进入 决赛 的 8 名 动 动员 。 决赛 时 8 名 运动 员 再 进行 1046414. et 
X. 在 2008 # 8 月 10 日 举办 的 第 29 届 北 京 奥运 会 女子 40 米 气 手 枪决 赛 中 ， 进 入 决赛 的 8 名 运动 员 的 预赛 
成 绩 和 最 后 10 枪 的 决赛 成 绩 见 表 4-1 所 示 . 


表 4-1 8 名 运动 员 决赛 成 绩 

















决赛 10 枪 成 绩 
ESU 93 









ot > Maa ape ee es aTa 
HE 中 国 . |. . 
卓 格 巴 德 拉 赫 | 蒙古 | 387 
妮 诺 | 格鲁吉亚 | 386 
维多利亚 ”| 白俄罗斯 | 384 
菜 万 多 夫 斯 卡 | 波兰 | 384 
亚 斯 娜 “| 塞尔维亚 | 384 
米 拉 芬兰 





95 | 5 |107] 92 | 92 
10.7 | 10.4 | 10.6 | 93 | 10.8 
10.5 | 9.2 | 10.5 | 98 | 86 
10.4 | 99 | 94 | 107 | 9.6 
91 | 97 | 10 | 9%3 | 99 























最 后 得 出 的 结论 是 ， 塞 尔 维 亚 的 运动 员 发 挥 是 最 稳定 的 ， 其 次 是 中 国运 动员 郭 文 瑞 ， 试 问 得 出 结论 的 依 
据 是 什么 呢 ? 


4.1 集中 趋势 的 指标 


is 
T” 
T. 





趋势 是 指 一 组 数据 向 某 一 中 心 值 靠拢 的 程度 ， 它 反映 了 一 组 数据 中 心 点 的 位 置 所 
在 ， 即 集中 趋势 是 找 出 一 组 数据 的 代表 值 。 前 面 已 经 介绍 过 数据 的 分 类 ， 其 中 以 计量 尺 / 
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不 同 ， 可 以 把 数据 分 为 分 类 型 数据 、 顺 序 型 数据 和 数值 型 数据 ， 且 3 种 不 同类 型 数据 ， 是 
从 低层 次 测量 数据 到 高 层次 测量 数据 ， 本 节选 用 这 3 种 不 同类 型 数据 分 别 介 绍 不 同 数据 集 
中 趋势 的 指标 。 需 要 强调 的 是 ， 低 层次 数据 的 集中 趋势 指标 适用 于 高 层次 测量 数据 ， 而 反 
过 来 ， 高 层次 测量 数据 的 集中 趋势 指标 不 适用 于 低层 次 的 测量 数据 。 
4.1.1 分 类 数据 一 一 众 数 

1. 众 数 的 定义 



































定义 4.1 一 组 数据 中 出 现 频数 最 多 的 变量 值 ， 称 为 众 数 ， 用 Mo 表示。 
众 数 主要 用 于 测量 分 类 型 数据 的 集中 趋势 , 同时 也 适用 于 测量 顺序 数据 和 数值 型 数据 。 
【 例 4.1】 某 研究 人 员 记 录 的 被 调查 者 的 性 别 见 表 4-2 所 示 ， 试 计算 这 组 数据 的 众 数 。 


表 4-2 被 调查 者 的 性 别 数据 





解 : 这 里 的 变量 为 性 别 ， 它 是 分 类 变量 ， 因 而 不 同 的 性 别 就 是 不 同 的 变量 值 ， 所 以 这 
里 只 有 “ 男 ” 和 “ 女 ”两 个 变量 值 s 在 所 有 20 位 被 调查 者 中 ,“ 男 ”变量 值 有 7 位 ， 所 以 
它 的 频数 为 7,“ 女 ”变量 值 有 f3- 往 ,> 所 以 它 的 频数 为 133 相对 “ 男 ” 变 量 值 ,“ 女 ”变量 
值 的 频数 最 多 ， 所 以 此 题 的 众 数 为 Sa 

【 例 4.2】 金融 学 院 2010 级 学 生 在 本 学 期 统计 Gank 4-3 所 示 ， 试 计算 这 组 数据 
的 众 数 。 














My 343. aeia 
人 数 
优秀 10 
良好 23 
中 等 23 
及 格 5 
不 及 格 2 





解 : 这 里 的 变量 为 “成 绩 等 级 ” 其 变量 值 为 “优秀 人 “良好 ”“ 中 等 ^“ 及 格 ” 和 “不 
及 格 ”。 从 表 中 看 ,“ 和 良好 ”和 “中 等 ”两 个 变量 值 的 频数 为 23， 比 其 他 的 变量 值 都 多 ， 所 
以 众 数 为 “良好 ”和 “中 等 ”。 

【 例 4.3】 在 某 城市 中 随机 抽取 了 9 个 家 庭 , 调查 得 到 每 个 家 庭 的 人 均 月 消费 数据 如 下 
(单位 : 元 )， 计 算 人 均 月 消费 的 众 数 。 

450 560 900 1080 570 810 710 720 460 

解 : 这 里 的 变量 是 数值 变量 ， 变 量 值 为 450、560、900、1 080、570、810、710、720、 
460。 从 数值 看 ， 每 一 个 变量 值 的 频数 都 为 1， 因 此 这 组 数据 没有 最 多 的 频数 ， 所 以 此 组 数 
据 无 众 数 。 


= 









































2. 众 数 的 特点 
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和 以 上 的 例题 可 以 总 结 出 众 数 具有 以 下 特点 。 
(1) 众 数 是 一 个 位 置 代 表 值 ， 它 不 受 极端 值 的 影响 。 
例如 ， 一 组 数据 750、850、960、1 080、1 080、1 250、1 630、2 000， 此 组 数据 的 众 


数 M0 二 1080， 当 这 组 数据 中 最 小 值 750 变 为 550 时 ， 众 数 还 是 M = 1 080。 所 以 它 不 受 极 





端 值 的 影响 。 





至 更 多 。 





如 图 4.1 所 示 。 
3. Excel 中 的 众 数 计算 函数 


























(2) 众 数 也 可 能 不 存在 ， 如果 存在 ， 并 不 是 唯一 的 ， 可 能 


一 个 ， 也 可 能 有 两 个 ， 甚 


例如 ， 例 4.1 有 一 个 众 数 ， 例 4.2 有 两 个 众 数 ， 例 4.3 无 众 数 。 
(3) 一 组 数据 9 众 数 代表 数据 是 否 有 明显 的 集中 趋势 或 最 高峰 包 汶 所 以 众 数 的 示意 
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, X 
利用 Excel 中 的 MODE 函数 可 以 计算 出 SASS 据 的 众 数 。 其 中 语法 为 MODE 
(numberl,number2,…)， 如 果 一 组 数据 中 不 含有 众 数 、\ MI 


MODE 函数 返回 错误 值 N/A。 
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图 4.1 众 数 示意 图 


41.2 ”顺序 数据 : 中 位 数 和 四 分 位 数 


分 位 数 是 指 在 一 组 排序 好 的 数据 中 ， 处 于 某 个 位 置 上 的 数据 ， 就 是 相应 的 分 位 数 ， 包 
括 中 位 数 、 四 分 位 数 、 十 分 位 数 和 百 分 位 数 等 。 以 下 主要 介 中 位 数 和 四 分 位 数 。 
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1. 中 位 数 
1) 中 位 数 的 定义 
定义 4.2 一 组 数据 按 顺 序 排列 后 处 于 中 间 位 置 上 的 变量 值 , 称 为 中 位 数 , 用 M, ER- 
中 位 数 的 定义 可 知 ， 中 位 数 是 把 一 组 数据 分 成 相等 的 两 部 分 ， 每 部 分 的 数据 包含 整 
组 数据 的 50%， 其 中 一 部 分 数据 比 中 位 数 小 ， 另 一 部 分 数据 比 中 位 数 大 。 中 位 数 主要 是 测 
量 顺序 数据 的 集中 趋势 ， 它 也 可 以 测量 数值 数据 的 集中 趋势 ， 但 不 可 以 测量 分 类 数据 的 集 
中 趋势 
2) 中 位 数 的 计算 公式 
根据 中 位 数 的 定义 ， 计 算 中 位 数 ， 首 先 要 对 数据 进行 排序 ， 然 后 确定 中 位 数 的 位 置 ， 
这 个 位 置 上 所 对 应 的 变 重 值 就 是 中 位 数 ， 那 么 中 位 数 的 位 置 确定 的 付 
中 位 数位 置 -2 ZAK (D) 


下 面 来 看 几 个 例题 ， 5 
【 例 4.4] 根据 表 4-2 的 数据 ， 计算 数据 的 中 位 a 

解 : 这 是 一 个 顺序 数据 ， 变 量 为 “成 绩 等 多 PRA “优秀 ”“ 良 好 ”“ 中 等 ””“ 及 格 ” 
和 “不 及 格 ” 是 变量 值 。 Tamu RO 序 的 ， 根 据 中 位 数 的 定义 得 知 处 于 中 间 位 
置 的 为 
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中 位 数 的 = =32 


f 
# ; 
a. a SEERE XAKI, HELM, = 
良好 。 人 wT 
【 例 4.5】 计算 价 生 3 数据 的 中 位 数 。 Ti 
450 560 .900- 1080 570 810 710: .720 460 
"R 值 数据 ， 变 量 为 人 区 月 消费 ， 要 想 计算 中 位 数 ， 首 先 把 数据 进行 排序 ， 
如 下 : 
450 460 560 570 mg 720 810 900 1080 


共 9 个 数据 ， 中 位 数 的 位 置 = 二 s, 即 为 710， 此 时 中 位 数 M。 = xpa 





【 例 4.6】 在 例 4.3 的 数据 组 中 加 入 一 个 数据 1 200 后 ， 计 算 新 数据 组 的 中 位 数 。 

fe: 加 入 一 个 数据 1 200 后 ， 新 数据 排序 后 如 下 : 

450 460 560 570 [iq 810 900 1080 1200 

这 时 新 数据 组 共有 10 个 数据 ， 则 中 位 数 的 位 置 = -5 .5， 即 中 位 数 处 于 第 5 个 位 置 
(对 应 的 变量 值 为 710) 和 第 6 个 位 置 (对 应 的 变量 值 为 720) 中 间 的 数据 ， 则 为 两 个 数据 的 加 
和 除 2， MUM. = 了 Ce + x, )=715- 





从 上 面 的 3 个 例题 可 以 得 出 中 位 数 的 计算 公式 为 


EW 


统计 数据 的 指标 度量 ,ut: 第 .乡音 
Xps 1 为 奇数 
M.= (4.2) 


了 Ge +a.) mamam 


3) 中 位 数 的 特点 

中 位 数 是 主要 测量 顺序 数据 的 集中 趋势 指标 ， 是 一 个 位 置 代表 值 ， 所 以 中 位 数 不 受 数 
据 组 的 极端 值 影响 。 

4) Excel 中 的 中 位 数 的 计算 函数 

利用 Excel 中 的 MEDIAN 函数 可 以 计算 出 一 组 数值 数据 的 中 位 数 。 其 语法 为 
MEDIAN(numberl ,number?2,...)。 y 

2. 四 分 位 数 r K 
D 四 分 位 数 的 定义 及 计算 公式 AN 
定义 43 EA EE A R, 

四 分 位 数 是 把 一 组 数据 四 等 分 ， 一 组 数据 四 等 3 个 点 ， 分 别 为 此 组 数据 的 中 
位 数 和 被 分 成 的 两 部 分 数据 各 自 的 中 位 数 ， 旧 wal: 4 25%、50% 和 75% 三 个 位 置 上 的 
r s stn S n ps ss 
er ee V ay Q X Qs 
表示 。 y SÑ g 

DAAE REENE, MA TEINAR EA, WA 
法 的 结果 有 一 定 的 差异 ， 但 差异 不 是 很 大 ， 本 书 四 分 位 数 的 位 置 确定 公式 为 


n 3n 


p I 4A N 
I Am t=T Ne (4.3) 
2) Excel 中 的 四 分 位 数 的 计算 函数 E S 
利用 ,Exeel “Ni QUARTILE 函数 匠 以 计算 出 一 组 数值 数据 的 四 分 位 数 。 其 中 语法 为 


QUARTIL quart), array 为 需要 求 得 四 分 位 数值 数据 的 单元 格 区 域 , quart 有 4 种 取 值 ， 
分 别 为 0、1、2、3 和 4， 不 同 的 取 值 ， 返 回 不 同 的 四 分 位 值 。 当 取 值 为 0 时 ， 返 回 这 组 数 
据 的 最 小 值 ， 当 取 值 为 1 时 ， 返 回 这 组 数据 的 下 四 分 位 数 ， 当 取 值 为 2 时 ， 返 回 的 是 这 组 
数据 的 中 位 数 ， 当 取 值 为 3 时 ， 返 回 的 是 这 组 数据 的 上 四 分 位 数 ， 当 取 值 为 4 时， 返回 这 
组 数据 的 最 大 值 。 

【 例 4.7】 根据 例 4.3 中 9 个 家 庭 的 消费 调查 数据 ， 计 算 人 均 月 消费 的 四 分 位 数 。 

解 :排序 后 的 数据 为 

450 460 560 570 710 720 810 900 1080 
共 9 个 数据 ， 则 纪 位 置 =4-2.25， 即 处 于 第 2 个 位 置 上 (变量 值 为 460) 和 第 3 个 位 置 


上 (变量 值 为 560) 间 ， 则 














































































































Q, =460 +0.25 x (560 — 460) = 485 
Cu 位 置 = 也 -675， 即 处 于 第 6 个 位 置 上 (变量 值 为 720) 和 第 7 个 位 置 上 (变量 值 为 810) 


间 ， 则 
Qu =720+0.75x(810 — 720) = 787.5 


NS 
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平均 数 


定义 4.4 一 组 数据 相 加 后 除 以 数据 的 个 数 而 得 到 的 结果 ， 称 为 平均 数 。 

平均 数 是 测量 数值 数据 的 集中 趋势 ， 不 适用 于 分 类 数据 和 顺序 数据 。 根 据 第 3 章 的 内 
容 ， 数 值 数据 的 整理 有 两 种 : 一 是 未 分 组 数值 数据 ; 二 是 分 组 数值 数据 ， 所 以 针对 这 两 种 
不 同 整 理 方式 的 数值 数据 有 两 个 不 同 的 平均 数 计算 形式 和 计算 公式 。 

1. 简单 平均 数 

1) 简单 平均 数 的 定义 及 计算 公式 

简单 平均 数 主要 是 测量 未 分 组 数值 数据 的 集中 趋势 。 

定义 4.5 未 经 分 组 的 一 组 样本 数据 为 x,x,,…,x, ， 样 本 数据 的 个 数 为 wm 则 样本 平均 
x， 称 为 简单 平均 数 。 
简单 平均 数 的 计算 公式 为 









































(4.4) 


【 例 4.8】 根据 例 43 中 的 9 个 家 庭 的 消 wanu, TB ABH taq WD. 
解 ， 根据 式 (4.4)， 有 





和 十 如 十 入 AS — 
= n N p hS 
_ 4501460500370 +710 +720 siogo oso 
9 A 
i Ver 695.6 SA ü 
> pavima > ` 


AE EELEE Tt Wa, 即 改变 这 组 数据 的 极 大 值 和 极 小 值 时 ， 

Pe 为 数 也 随 之 改变 。 

2. 加 权 平 均 数 

1) 加 权 平 均 数 的 定义 及 计算 公式 

加 权 平 均 数 主要 是 测量 分 组 数值 数据 的 集中 趋势 。 

定义 46 将 原始 数据 分 成 K 组 ， 各 组 的 数据 用 各 自 组 中 值 来 表示 ， 各 组 变量 值 出 现 
的 个 数 用 各 自 的 频数 表示 ， 这 样 的 数据 平均 数 称 为 加 权 平均 数 。 

设 原始 数据 分 组 ， 各 组 的 组 中 值 分 别 为 Mi,M,,…,M, ， 各 组 变量 值 出 现 的 频数 为 
三, 记 ,…,f ， 则 样本 平均 数 的 计算 公式 为 





=_ MA+tM,fp+.…+M, f, ÈM, 
x= = (4.5) 
f k f, Le + f, n 
式 中 ，m= 帮 + 万 +…+ 大 ， 即 样本 容量 。 


【 例 4.9】 某 企业 职工 年 收入 统计 资料 见 表 4-4 所 示 , 试 计算 这 个 企业 职工 平均 年 收入 。 

















EW 


统计 数据 的 指标 度量 ,st: 第 .乡音 


表 4-4 某 企 业 职工 年 收入 数据 




















年 收入 /万 元 职工 人 数 /人 
2.0~3.0 6 
3.0~4.0 10 
4.0~5.0 18 
5.0 一 6.0 12 
6.0 一 7.0 7 
合计 53 























解 : 这 是 一 组 分 组 数值 数据 ， 计 算 平均 数 使 用 加 权 平 均 数 。 根 据 式 (4.5) 有 
M f, +M,f,+---+ M, f, KAN 
A+f,+---+ f, 
_6x2.5+10x3. 5+18x4.5+12x515 27265 
53 y 


x= 





=4.58 

其 中 每 组 的 组 中 值 分 别 为 2.5S、3.53、4.5 习 SSS SS 各 组 的 频数 分 别 为 6、 1 12 

和 7。 

从 加 权 平均 数 的 公式 得 知 ， maqma 的 实际 变量 值 ， 如 果 各 组 数据 

在 组 内 是 均匀 分 布 的 ， 则 计算 结果 还 是 是 比较 准确 的 ; 如 果 各 组 数据 在 组 内 是 非 均匀 分 布 的 ， 

则 误差 较 大 。 所 以 一 般 情况 下 , ` 在 各 组 数据 均匀 分 布 的 前 提神 ,使 用 加 权 平均 数 来 计算 平 
均 数 。 A p> 

















2) 加 权 平 均 数 的 特点 

从 加 权 平 均 数 的 定义 可 以 得 知 ， 其 数值 的 犬 小 “不 秽 受 各 组 组 中 值 的 影 响 ， 而 且 受 各 组 
变量 值 频数 的 影响 ;_ 即 当 一 组 频数 较 大 时 齐 意味 着 这 组 数据 的 个 数 较 多 ， 则 这 组 数据 的 组 
中 值 对 平均 数 的 影响 较 大 。 

3，Exc&h 囊 的 加 权 平 均 数 的 计算 函数 

利用 Excel 中 的 AVERAGE 函数 可 以 计算 出 一 组 数值 数据 的 平均 数 。 其 语法 为 
AVERAGE(numberl,number2,...)， 返 回 其 参数 的 算术 平均 值 ， 参 数 可 以 是 数值 或 包含 数值 
的 名 称 、 数 组 或 引用 。 
414 众 数 、 中 位 数 和 平均 数 的 关系 


众 数 、 中 位 数 和 平均 数 都 是 测量 数值 数据 的 集中 趋势 度量 指标 ， 则 三 者 存在 的 关系 

































当 一 组 数据 是 对 称 分 布 时 ， 众 数 M。 、 中 位 数 M. 和 平均 数 元 必定 相等 ， 即 
=x, WA 4.2(a) 所 示 。 
° O) 一 组 数据 是 左 偏 时 ， 众 数 M, 、 中 位 数 M. MF S KRII <M, <M,» W 
4.2(b) 所 示 。 
原因 : 左 偏 分 布 ， 说 明 数 据 存在 极 小 值 ， 而 中 位 数 和 众 数 不 受 极端 值 的 影响 ， 而 平均 
受 极端 值 影响 ， 所 以 平均 数 向 极 小 值 一 方 发 展 。 
(3) 当 一 组 数据 是 右 偏 时 , 那么 众 数 M。、 中 位 数 M. 和 平均 数 谍 的 关系 为 Mu < M. < 工 ， 


Aog 
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如 图 4.2(c) 所 示 。 
原因 : 右 偏 分 布 ， 说 明 数 据 存 在 极 大 值 ， 而 中 位 数 和 众 数 不 受 极端 值 的 影响 ， 而 平均 
受 极端 值 影响 ， 所 以 平均 数 向 极 大 值 一 方 发 


AAD 


Mo x M.M, M M, x 
e (b) 左 偏 分 布 ce 


图 4.2 不 同 分 布 的 众 数 、 r 


根据 众 数 、 中 位 数 和 平均 数 三 者 存在 的 关系 ， 给 出 “utani 可 以 计算 出 这 组 数据 的 
众 数 、 中 位 数 和 平均 数 ， 利 用 三 者 的 关系 ， Wh 据 的 分 布 情况 。 


4.1.5” 众 数 、 中 位 数 和 平均 数 应 用 的 注意 事 


(1) 众 数 可 以 测量 分 类 数据 、 os 数据 ， 但 主要 适用 于 测量 分 类 数据 的 集 
中 趋势 度量 。 如 果 一 组 数据 量 较 多 时 如 果 一 组 数据 量 较 少时 ， 不 宣 采用 众 数 。 

(2) 中 位 数 是 ne 值 ， 它 不 受 极端 值 的 影响 。 当 一 组 数据 的 分 布 仿 
站 i 它 也 是 最 主要 测量 顺序 数 
据 的 。 rYA 

(3) 平均 数 是 针对 数值 数据 集中 趋势 的 指标 ,六 可 以 测量 其 他 数据 ， 但 对 于 数值 数 
据 的 指标 却 有 也 个 ， 选 择 使 用 哪个 指标 是 非常 重 变 的 。 当 一 组 数据 是 非 对 称 分 布 时 ， 如 果 
选择 平均 数 测量 数值 数据 ， anp anKicktitis, ri5i9WsisIKE SW, 1 
时 要 考虑 使 用 众 数 或 中 位 数 ， 如 果 一 组 数据 是 对 称 分 布 ， 数 值 数 据 采用 平均 数 作为 它 的 集 
中 趋势 测量 指标 。 



















































































42 ”离散 程度 的 绝对 指标 


集中 趋势 是 选 出 一 组 数据 的 代表 值 ， 选 出 代表 值 后 ,也 要 对 代表 值 的 代表 性 进行 评价 ， 
对 一 组 数据 各 变量 值 向 代表 值 靠拢 的 程度 ， 或 各 变量 值 之 间 的 差异 状况 进行 评价 ， 即 数据 
离散 程度 的 度量 。 

离散 程度 是 指 一 组 数据 中 各 变量 值 远离 其 中 心 值 (代表 值 ) 的 程度 。 数 据 的 离散 程度 越 
大 ， 集 中 趋势 选 出 的 代表 值 的 代表 性 就 越 差 ， 离 散 程度 越 小 ， 代 表 值 的 代表 性 就 越 强 。 
本 节 同 样 按照 数据 的 计量 尺度 不 同 ， 即 分 类 数据 、 顺 序数 据 和 数值 数据 (从 低 到 高 ) 顺 
序 来 讲解 。 


421 分 类 数据 一 异 众 比率 
定义 4.7 非 众 数组 的 频数 占 总 频数 的 比率 ， 称 为 异 众 比 率 ， 用 也 表示 。 
Wh 














统计 数据 的 指标 度量 ,st: 第 . 乡 章 
根据 定义 ， 可 得 知 异 众 比率 的 计算 公式 为 
> sss 
y == — 4.6 
人 “o 
RP, Y £ WERAK MA f, 为 众 数组 的 频数 。 
【 例 4.10】 一 家 市 场 调查 公司 为 研究 不 同 饮料 的 市 场 占 有 率 ， 对 随机 抽取 的 一 家 超市 
进行 调查 。 调 查 人 员 在 某 天 50 记录 名 顾客 购买 的 饮料 ， 经 统计 得 到 表 4-5， 试 计算 异 众 
比率 。 








表 4-5 不 同 饮料 的 频数 分 布 表 1 









不 同 饮料 
碳酸 饮料 








M: BX 4-5 可 知 ， 这 是 分 类 数据 %- 且 众 数 M = 碳酸 饮料 ， 其 他 变量 值 为 非 众 数 。 
NS ONN. _50-15_. C 


MND 50 


这 说 明 ， 在 所 调查 的 $0 关 中， 有 70% 的 人 购买 的 不 是 碳酸 饮料 ， 只 有 30% 的 人 购买 


了 碳酸 饮料 。 
【 例 4.11 将 表 415 中 的 数据 更 改 为 表 4-6 的 数据 ， 试 计算 异 众 比 率 。 
表 4-6 不 同 饮料 的 频数 分 布 表 2 














”不同 饮料 频数 
碳酸 饮料 35 

冰 红 茶 3 

冰糖 雪梨 5 

果汁 4 

矿泉 水 1 

合计 50 





解 : 由 表 4-6 中 可 知 ， 众 数 还 是 Mu = 碳酸 饮料 ， 其 他 变量 值 为 非 众 数 。 











XZ 0 =30% 
这 说 明 ， 在 所 调查 的 30 人， 有 30% 的 人 购买 的 不 是 碳酸 饮料 ，70% 的 人 购买 了 碳酸 


饮料 。 
比较 例 4.10 和 例 4.11 的 结果 , 可 以 看 出 , 例 4.11 的 异 众 比率 小 于 例 4.10 的 , 而 例 4.11 
的 异 众 比率 说 明 调查 的 50 人 ， 只 有 30% 没 有 购买 碳酸 饮料 ( 众 数 )， 说 明 在 例 4.11 中 ， 众 数 


NR) 
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比例 4.10 中 的 代表 性 强 。 由 此 ， 得 出 以 下 结论 

异 众 比率 越 大 ,说 明 众 数 的 代表 性 就 越 差 : 异 众 比 率 越 小 ， 说 明 众 数 的 代表 性 就 越 强 。 

异 众 比率 主要 测量 分 类 数据 的 离散 程度 ， 同 时 也 可 以 测量 顺序 数据 和 数值 数据 的 离散 
程度 。 
422 ”顺序 数据 一 一 四 分 位 差 

定义 4.8 上 四 分 位 数 与 下 四 分 位 数 之 差 , 也 称 内 距 或 四 分 间距 , 称 为 四 分 位 差 , 用 Q, 
表示 。 

根据 四 分 位 差 的 定义 ， 得 出 四 分 位 差 的 公 于 
9, na 9. 4 an) 
由 4.1 节 的 内 容 知道 ， 下 、 上 四 分 位 数 分 别 是 处 于 一 组 wass 和 75% 位 置 上 的 
变量 值 ， 也 就 是 说 四 分 位 差 包 含 了 一 组 数据 中 间 的 sma 映 中 间 50% 数 据 的 离散 















































程度 。 如 果 四 分 位 差 的 值 越 小 ， 意 味 着 中 间 50% 的 数 中 位 数 靠拢 ， 即 中 位 数 的 代表 
性 就 越 强 ， 如 果 四 分 位 差 的 值 越 大 ， DEER 据 越 分 散 ， 中 位 数 的 代表 性 就 
越 弱 。 





[J 4.12] 根据 例 4.7 的 计算 结果 ， as 
解 : 根据 例 4.7 的 计算 结果 可 知 : 
人 SN 2 -485 
所 以 四 分 位 差 为 ` 
> 1Q, >Q, - Q, =785.5- 48. AAP 

四 分 位 差 主要 用 “MOBI Bu, 同时 也 可 以 3 量 妆 全 数据 离 攻 程度 ， 但 不 适用 于 测 

量 分 类 数据 的 离散 。 一 
> XN 
423 MENETES O 
J 

定义 49 各 变量 值 与 其 平均 数 离 差 平方 的 平均 数 ， 称 为 方差 。 总 体 的 方差 用 RR, 
样本 方差 用 s* 表示 。 

定义 4.10 方差 的 平方 根 称 为 标准 差 。 

标准 差 是 最 常用 最 基本 的 一 种 标志 变异 指标 。 总 体 的 标准 差 用 o 表示 , 样本 标准 差 用 s 
表示 。 

1. 样本 方差 和 标准 差 的 计算 

根据 样本 数据 分 为 分 组 数据 和 未 分 组 数据 ， 有 两 种 样本 方差 和 标准 差 的 计算 公式 。 


























1) 未 分 组 数据 
根据 方差 的 定义 ， 样 本 方差 计算 公式 为 
六 全- 到 
2 = 也 一 (4.8) 
n—l 
2) 分 组 数据 








分 组 数据 ， 各 变量 值 用 所 在 组 的 组 中 值 来 替代 ， 所 以 其 计算 公式 为 
(EW 
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PAM 7) 


n—1 





3) 自由 度 
以 上 两 个 公式 的 分 母 都 为 4-1， 即 样本 数据 的 个 数 减 1， 称 之 为 自由 度 。 自 由 度 是 指 
在 一 组 数据 有 一 个 附加 的 约束 时 ， 自 由 取 值 的 变量 个 数 。 
例如 ，x + =2xX ， 其 中 X=1， 即 x+x, =2， 两 个 变量 相 加 和 为 2， 这 时 两 个 变量 
度 自由 取 值 的 只 有 一 个 变量 ，1 为 此 数据 的 自由 度 。 
再 如 ，x + + 加 =35 ， 开 再 固定 ，3 个 变量 自由 取 值 的 只 有 两 个 ，2 为 自由 度 。 依 次 
类 推 ， 在 样本 方差 公式 中 ， 有 下 这 个 附加 的 约束 ， 所 以 用 +…+x 三 1 工 ，n 个 变量 中 自 
取 值 的 及 一 1 个 ，n 一 1 为 自由 度 。 A 
4) 样本 标准 差 的 计算 K 
根据 标准 差 的 定义 ， 有 其 计算 公式 为 < 
Z Ñ 














































































































(4.10) 
2. 总 体 方差 和 标准 差 的 计算 ,KX 
1) 未 分 组 总 体 方差 的 计算 V: 
未 分 组 总 体 方差 的 计算 公式 为 、 < 
> o Sa-a x Q 
Ye = 与 r sN Wx (4.11) 
Ww L 
2) i q 
分 组 总 体 方差 的 计算 公式 为 N 
A, 
No , Nf -py 
= =l 
2 =Ë (4.12) 
3) 总 体 的 标准 差 计算 
s= Jo: (4.13) 


3. Excel 中 标准 差 和 方差 的 计算 函数 

1) 标准 差 的 计算 函数 

利用 Excel 中 的 STDEV 函数 可 以 计算 出 一 组 数值 数据 的 标准 差 。 其 中 语法 为 
STDEV(numberl,number2,.….)， 返 回 其 参数 的 标准 差 ， 参 数 可 以 是 数值 或 包含 数值 的 名 称 、 
数组 或 引用 。 
2) 方差 的 计算 函数 

利用 Excel 中 的 VAR 函数 可 以 计算 出 一 组 数值 数据 的 方差 。 其 语法 为 
VAR(numberl,number2,.….)， 返 回 其 参数 的 方差 ， 参数 可 以 是 数值 或 包含 数值 的 名 称 、 数 组 
或 引 




















































































































【 例 4.13】 根据 表 4-3 的 数据 ， 计 算 该 企业 职工 年 收入 的 标准 差 。 
Nk) 
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解 : 根据 样本 方差 公式 有 





k 
DSM, -X° 
s? = i=l 
n—1 
_ 6x(2.5—4.6)* +10x(3.5—4.6)* +18x (4.5-4.6) +12 (5.5 — 4.6)? + 7x (6.5 — 4.6)° 
E 53-1 
=1.42 


s= s =VL42 =1.19 
424 ”相对 离散 程度 一 一 离散 系数 


以 上 介绍 了 数值 数据 离散 程度 的 测量 指标 ， 即 方差 和 标准 差 ， 差 和 标准 差 反 映 的 是 
各 变量 值 变 异 程度 的 绝对 指标 ， 其 数值 的 大 小 受 game 4 影响 ， 且 也 受 平均 水 
平 的 影响 。 例 如 ， 测 量 20 人 身高 的 离散 程度 ， 当 不 同 研究 用 不 同 单位 时 ， 即 研究 人 
员 采 用 m 为 单位 ， 得 出 一 个 标准 差 数值 ， 另 一 个 研究 A cm 为 单位 ， 得 出 另 一 个 标 
准 差 数值 ， 两 个 数值 不 相等 。 为 了 消除 计量 单 全 了 水平 高 低 不 等 的 影响 ， 采 用 反 
映 离散 程度 的 相对 指标 ， 即 离散 系数 。 
定义 4.11 一 组 数据 的 标准 差 与 Sennante 称 为 离散 系数 ， 用 屎 表示 。 


其 计算 公式 为 SN- 
> V, == >N (4.14) 


ETT 的 相对 指标 ， 可 以 应 P estas 散 程度 。 
离散 系数 大 的 ， 说 明 数 据 的 离散 程度 越 大 ， 代表 人 离散 系数 小 的 ， 说 明 数 据 
的 离散 程度 越 少 ， "R N 


AG 4 3 数据 的 相对 位 置 测量 _ RENA 


























在 生活 中 ， 人 们 经 常 要 测量 数据 的 相对 位 置 ， 即 测量 某 个 数据 在 一 组 数据 中 的 位 置 。 
例如 ， 某 个 同学 在 期 末 考试 中 货币 银行 学 取得 89 分 ， 统 计 学 取得 75 分 ， 试 问 他 哪 科 
成 绩 较 好 ? 这 时 我 们 不 能 用 分 数 的 绝对 值 来 进行 衡量 ， 因 为 会 存在 一 种 可 能 ， 货 币 银行 学 
全 班 取 的 成 绩 都 较 高 或 货币 银行 学 的 试卷 较 简单 ， 而 统计 学 试卷 较 难 ， 所 以 不 能 用 绝对 值 
衡量 他 哪 科学 得 好 。 这 时 我 们 可 以 采用 相对 指标 ， 即 计算 这 两 科 分 数 在 全 班 分 数 数据 中 的 
位 置 。 
定义 4.12 变量 值 与 其 平均 数 的 离 差 除 以 标准 差 后 的 值 ， 称 为 标准 分 数 ， 用 Z 表示 。 
根据 标准 分 数 定义 ， 其 计算 公式 为 
Z= 





























n- 





(4.15) 


S 
标准 分 数 是 测量 各 变量 值 在 所 在 的 数据 中 的 位 置 。 例 如 ， 如 果 某 个 变量 值 的 标准 分 数 
为 -1 时 ,说 明 其 变量 值 低 于 平均 值 , 且 低 于 一 个 标准 差 : 如 果 某 个 变量 值 的 标准 分 数 为 1 时 ， 
说 明 其 变量 值 高 于 平均 值 ， 且 高 出 一 个 标准 差 。 
Wh 
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【 例 4.14】 某 个 同学 在 期 末 考 试 中 货币 银行 学 取得 89 分 ， 全 班 同学 的 货币 银行 学 均 
值 为 75 分， 标准 差 为 7 分 ， 统 计 学 取得 75 分 ， 全 班 同学 统计 学 均值 为 60 分 ， 标 准 差 为 5 
分 。 试问， 这 名 同学 哪 科学 得 好 ? 

解 ; 比较 该 名 学 生 的 哪 科学 得 好 ， 只 需 测量 出 他 每 和 成 绩 在 全 班 的 位 置 ， 即 相对 位 置 。 
所 以 有 

货币 银行 学 的 位 置 : 
xx _89-75_, 
#š 7 








统计 学 的 位 置 ， 
x-7 _75-60_ 
A A 
即 该 名 学 生 货币 银行 学 高 于 全 班 的 均值 ， BRET 2 个 标准 差 人 而 统计 学 高 于 全 班 的 平均 和， 
且 商 于 3 个 标准 差 。 结 论 是 ， 该 名 学 生 统计 学 学 得 较 AD 


44 RSS -ca 


o 4 测量 ， 但 这 两 部 分 的 学 习 仅 可 以 了 解数 据 分 
布 的 一 些 特 点 ， 要 想 全 面 了 解数 据 分 布 前 特点 ， 还 是 不 够 的 。 例 如 ， 给 出 一 组 样本 数据 
mush RAR. w Say PNO 站 数值 ， 通 过 3 个 MAER, 初步 了 角 到 用 报 分 
是 对 称 还 是 非 对 称 ， 但 如 果 是 非 对 称 时 ， we 如 果 是 对 称 的 ， 无 法 
知道 数据 的 扁平 程度 ) De 


4.4.1 mapis 
TE si ü " 
1. 偏 态 及 偏 态 系数 的 定义 > 


定义 413 数据 分 布 的 不 对 称 ， 称 为 偏 态 。 

偏 态 是 对 数据 分 布 对 称 性 的 测量 ， 如 果 要 测量 偏 斜 程度 的 话 ， 需 要 计算 偏 态 系数 。 
定义 4.14 数据 分 布 不 对 称 的 度量 值 ， 称 为 偏 态 系数 ， 用 SK 表示 。 

其 计算 公式 为 











= 


-Fy 
sk- x (4.16) 
n-—1 s 
(1) 当 偏 态 系数 为 0 时， 说 明 这 组 数据 是 对 称 分 布 的 。 
(2) 当 偏 态 系数 为 正 值 时 ， 表 示 这 组 数据 是 右 偏 的 ， 偏 态 系数 越 大 ， 偏 斜 的 程度 也 就 
BRK. 
(3) 当 偏 态 系数 为 负 值 时 ， 表 示 这 组 数据 是 左 偏 的 ， 偏 态 系数 越 小 ， 偏 斜 的 程度 也 就 
越 大 。 
2. Excel 中 偏 态 系数 的 计算 函数 


利用 Excel 中 的 SKEW 函数 可 以 计算 出 一 组 数值 数据 的 偏 态 系数 SK。 其 语法 为 
SKEW(numberl,number?,...)。 
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442 峰 态 及 峰 态 系数 
1. 峰 态 及 峰 态 系数 的 定义 


定义 4.15 数据 分 布 的 平 峰 或 尖峰 程度 ， 称 为 峰 态 。 
峰 态 是 对 数据 对 称 分 布 的 扁平 测量 ， 如 果 要 测量 扁平 程度 ， 需 要 计算 峰 态 系数 。 
定义 4.16 ”数据 分 布 峰 态 的 度量 值 ， 称 为 峰 态 系数 ， 用 天 表示 。 


其 计算 公式 为 
z4 
K Ee 226 = ° (4.17) 
n-1 s -3 
峰 态 通常 是 相对 于 标准 正 态 分 布 而 言 的 。 ” 


(1) 当 峰 态 系数 为 0 时 ， 说 明 这 组 数据 是 标准 正 态 分 布 的 。 K 
O) MESRINE, RALAR, FIN Sew 
人 当 二 条 为 仙人 时 ， 表 示 这 组 数据 是 有 的 全 


2. Excel 中 峰 态 系数 的 计算 函数 


利用 Excel 中 的 KURT ASA X 值 数 据 的 峰 态 系数 K。 其 语法 为 
KURT(numberl,number?2,...)。 


4.5 案例 分 析 : mesas 的 调查 与 agn Excel 上 机 
- i 标 


n: Os s 首先 要 计算 出 啤 
酒 综合 印象 分 数 ; 品 作 过 程 如 下 

打开 《自动 统计 调查 结果 ” Tia QY >A 列 “ 啤 酒 印象 分 数 ” 同时 设 非 
常 不 同意 ， 不 同意 为 2 分 ， 中 立 为 3 分 ， 同 意 为 4 分 ， 非 常 同 意 为 5 分 ， 所 以 对 啤 
酒 的 印象 得 根据 “调查 问卷 ”中 的 第 9 题 来 计算 ， 计 算 方 法 为 (1)+(2)+(4)-(3)-(5)， 然 后 
拖 动 AA2 单元 格 右 下 角 的 填充 柄 向 下 复制 公式 ， 计 算出 每 位 受 访 者 的 啤酒 综合 印象 分 数 ， 
如 图 4.3 所 示 。 


据 比较 集中 。 
数据 比较 分 散 。 





























ra ETAN 
I ° r r 
a mesa mwa BHE (0 BAR Co mesa amaa wa =. s> == sa was == w 
Fal FR a 
一 mmm; sms TN O S m pe a -E 
< 12 rae + ae *= oa 
5 a Re "= sae $a 
s Aaw erag mg "= + 
Ea A sme sze rae me 
s E FRE s Srat 2 
1 taa sr =. ez $2 
w) è saa semg s sae mag ao i 
pen g me mg == 
ea Re p2 me $2 
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图 4.3 计算 啤酒 印象 分 数 


Ah 
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上 面 已 经 介绍 过 ， 描 述 一 组 数据 的 特性 ， 通 常用 该 组 数据 的 描述 性 指标 来 反映 其 分 布 
的 情况 ， 即 计算 出 一 组 数据 的 平均 数 、 标 准 差 、 众 数 、 中 位 数 等 指标 ， 方 便 用 户 从 “集中 
程度 ”和 “离散 程度 ”两 个 角度 对 样本 数据 进行 观察 。 本 节 采 用 Excel 软件 ， 使 用 两 种 方 
法 来 计算 。 
4.5.1 不 同性 别 的 啤酒 印象 分 数 分 布 情况 

首先 分 析 一 下 性 别 是 否 会 对 啤酒 印象 分 数 有 影响 ， 即 计算 男 、 女 两 组 啤酒 印象 分 数 描 
述 性 指标 。 这 里 采用 Excel 统计 函数 来 计算 每 个 指标 的 数值 。 

第 一 步 : 建立 一 个 新 的 工作 表 ， 命 名 为 “性 别 对 啤酒 印象 分 数 的 影响 分 析 ”， 并 把 性 别 
和 啤酒 印象 分 数 的 数据 复制 到 该 工作 表 中 ， 如 图 4.4 所 示 。 A 
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图 4.4 “性 别 对 啤酒 印象 分 数 的 影响 分 析 ” 工 作 表 


第 二 步 : 利用 Excel 中 的 自动 筛选 功能 分 别 筛选 出 样本 中 男 、 女 性 各 自 的 啤酒 印象 分 
数 ， 如 图 4.5 所 示 。 
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第 三 步 : 在 “性 别 对 啤酒 印象 分 数 的 影响 分 析 ” 工 作 表 中 ， 输 入 如 图 4.6 所 示 的 内 容 。 


























图 4.6 S aR 


第 四 步 : 在 F40 单元 格 中 输入 函数 “= Nos: A50)”， 得 到 女性 样本 的 啤酒 印 


象 分 数 平均 数 ， 同 样 在 G40 单元 格 中 输入 
啤酒 印象 分 数 平均 数 。 结果 如 图 4.7 Ü RA 





“=AVERAGE(B39:B56)” 计 算 男 性 样本 的 





















REGEER | 性 别 对 啤酒 印象 分 数 的 影响 分 析 J 
图 4.7 计算 样本 的 啤酒 印象 分 数 平均 数 
第 五 步 : 在 F41 单元 格 中 输入 函数 “=MEDIAN(A39:A50)”， 得 到 女性 样本 的 啤酒 印象 
分 数 中 位 数 ， 同 样 在 G41 单元 格 中 输入 函数 “=MEDIAN(B39:B56)” 计 算 男 性 样本 的 啤酒 
印象 分 数 中 位 数 。 结 果 如 图 4.8 所 示 。 
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9 E3 男 

1 | 平均 数 9.166666667 
" pt [ F| 10 
" | 众 数 

6 | 标准 差 

9 | 方差 

" 最 大 值 

" 小 

















图 4.8 hpi 蒙 分 数 中 位 数 

第 六 步 : 在 F42 单元 格 中 输入 函数 “=MoD (A39:A50)”， 得 到 女性 样本 的 啤酒 印象 分 

数 众 数 ， 同样 在 G42 USB B ° —MODE(B839:856, 计算 男性 样本 的 啤酒 印象 分 
数 众 数 。 结 果 如 图 4.9 所 示 。 À oo x 
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多 吉 洁 果 娄 据 盏 记 样 本 绍 成 分析 性别 对 啤酒 印象 分 数 的 影响 分 析 . 





图 4.9 计算 样本 的 啤酒 印象 分 数 众 数 
第 七 步 : 在 F43 单元 格 中 输入 函数 “=STDEV(A39:A50)”， 得 到 女性 样本 的 啤酒 印象 
分 数 标准 差 ， 同 样 在 G43 单元 格 中 输入 函数 “=STDEV(B39:B56)”， 计 算 男性 样本 的 啤酒 
印象 分 数 标准 差 。 结 果 如 图 4.10 所 示 。 
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2 女 
40 2 y | 平均 数 — 3.166666667 9.166666667| 
t u 中 位 数 2 10 


í u | 众 数 11 
6 标准 差 [zs] 2. 502939448 















Æ 4.10 ; fm l 酒 印象 分 数 标准 差 
第 八 步 : 在 F44 单元 格 中 函数 “=VAR(A39:A50)” ,得 到 女性 样本 的 啤酒 印象 分 数 
方差 :同样 在 G44 单元 格 中 输入 函数 “=VAR(B39:B56)?”， j 性 样本 的 啤酒 印象 分 数 方 
差 。 结 果 如 图 4.11 所 示 * “个 ed 
















E3 
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9. 166666667 


标准 差 2. 502939448] 
6. 264705882| 








图 4.11 计算 样本 的 啤酒 印象 分 数 方差 


gy 





第 九 步 : 在 F45 单元 格 中 输入 函数 “=MAX(A39:A50)”， 得 到 女性 样本 的 啤酒 印象 分 
数 最 大 值 ， 同 样 在 G45 单元 格 中 输入 函数 “=MAX(B39:B56)”， 计 算 男 性 样本 的 啤酒 印象 
分 数 最 大 值 。 结 果 如 图 4.12 所 示 。 
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3. 166666667 9. 166666667 
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3.069892901 “2. J2% `, 
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第 十 步 : 在 F46 MERK TIÑA 06 38 “=MIN(A39: Xo a EEUE 
最 小 值 ， 同 样 在 G46 i RR ng 6)”， 计 算 男性 样本 的 啤酒 印象 分 数 
最 小 值 。 结果 如 图 4.13 3 所 示 。 š 













9. 166666667| 
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2 











图 4.13 计算 样本 的 啤酒 印象 分 数 最 小 值 
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统计 学 (Q) 理论 5 实务 — í í í 


第 十 一 步 : 最 后 得 到 如 图 4.14 所 示 的 结果 





女 
平均 数 ” 3.166666667 9.166666667| 
中 位 数 f 10 
众 数 2 11 
标准 差 3.069892901 2. 502939448| 


方差 9. 424242424 6. 264705882 
最 大 值 了 12 
最 小 值 4 2 











4.14 ”统计 结果 报表 


根据 图 4.14 的 描述 性 统计 结果 报表 可 知 ， 男 性 对 啤酒 的 平均 印象 分 数 远 远 高 于 女性 
(9.17>3.17)， 即 男性 对 啤酒 的 印象 较 佳 ， 而 女性 对 啤酒 的 印象 较 差 .得 虽然 从 描述 统计 分 
析 结 论 来 看 是 这 样 ， EAEE E SEZ MAA, K 要 借助 于 另外 
分 析 工 具 进行 分 析 检 验 。 


< 
4.52 不 同学 历 的 啤酒 的 印象 分 数 分 布 情况 S 


分 析 不 同学 历 的 啤酒 印象 分 数 的 分 布 情况 ， et 不 再 用 
— G 5 操作 过 程 如 下 

一 步 : 建立 一 个 新 的 工作 表 ， 命 名 为 j 对 啤酒 印象 分 数 的 影响 分 析 ”， 然 后 把 学 
nese 人 提包 工人 r 如 图 4.15 所 示 。 
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高 中 及 以 下 9 








图 4.15 “学 历 对 啤酒 印象 分 数 的 影响 分 析 ” 工 作 表 
第 二 步 : 利用 Excel 中 的 自动 筛选 功能 分 别 筛选 出 样本 中 不 同学 历 的 各 自 啤酒 印象 分 
数 ， 如 图 4.16 所 示 。 
第 三 步 : 单 击 “ 数 据 ” 一 “分 析 ” 一 “数据 分 析 ” 按 钮 ， 弹 出 “数据 分 析 ” 对 话 框 ， 
在 “分 析 工 具 ” 列 表 中 选择 “描述 统计 ”选项 ， 如 图 4.17 所 示 。 
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图 4.16 样本 中 不 同学 历 的 各 自 啤酒 印象 分 数 


第 四 步 : 单 击 “ 确 定 ” 按 钮 后 ， 弹 出 “描述 统计 ”对 话 框 ， 需 要 填 好 数据 的 输入 区 域 
A40:D56， 填 好 输出 区 域 F47， 选 择 统计 指标 ， 即 选择 汇总 统计 ， 如 图 4.18 所 示 。 
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V 4.18 “描述 统计 ”对 话 框 


aoia IR. 


























高 以 R 大 RERU 
E 条 
K Esa PN 10.5 7.3833333” 平均 5. 5625 平均 8.1666667| 
N URE 1.5 WERE t a 标准 误差 0. 98305964 标准 误差 1.5365907| 
10.5 中 位 数 中 位 数 6.5 中 位 数 10 
P, #N/A 众 数 众 数 T 众 数 11 
标准 差 2.1213203 标准 差 4 i 标准 差 ”3.93223855 ”标准 差 3.7638639| 
方差 4.5 方差 19. 466667 方差 15. 4625 方差 14.166667| 
峰 度 #DIV/O! 峰 度  3.1789501 — 峰 度 -1.2151768 。 峰 度 -0.327031 
RE #DIY/0! 偏 度 -1.716945 E -0.0917788 MÆ — -1.172769| 
区 域 3 区 域 12 区 域 12 区 域 3 
最 小 值 9 R ME -1 最 小 值 SI 最 小 值 2 
最 大 值 12 最 大 值 11 最 大 值 11 最 大 值 fi. 
求 和 21 求 和 “4 求 和 89 求 和 49 
观测 数 2 观测 数 6 观测 数 16 观测 数 6 
图 4.19 统计 结果 
从 图 4.19 的 统计 结果 可 以 看 出 ， 高 中 及 以 下 对 啤酒 的 印象 分 数 最 高 ， 其 次 是 研究 生 及 
以 上 ， 再 次 是 大 专 学 历 ， 最 后 是 本 科学 历 。 高 中 及 以 下 这 组 由 于 数据 过 少 ， 因 此 出 现 了 众 


























数 、 峰 度 、 偏 度 无 值 或 错误 标志 。 从 这 30 个 观测 值 可 以 看 出 ， 学 历 对 啤酒 印象 分 数 有 显著 
的 影响 ， 但 由 于 样本 的 随机 性 ， 因 此 还 不 能 非常 肯定 地 说 学 历 对 啤酒 印象 分 数 有 影响 ， 还 
需要 借助 其 他 的 检验 方法 来 肯定 。 
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一 、 填 空 题 


1 
z. 
3; 
4 
5 


数 为 ( 


( ) / 


， 一 组 数据 中 出 现 频数 最 多 的 变量 值 为 (。”)。 

.一 组 数据 排序 后 处 于 中 间 位 置 上 所 对 应 的 变量 值 为 ( )。 

上 四 分 位 数 减 下 四 分 位 数 的 结果 ， 称 为 ( o 

。 当 一 组 数据 的 众 数 、 中 位 数 和 平均 数 相 等 时 ， 这 组 数据 的 分 布 (  ). 

一 组 数据 的 离散 系数 为 0.4 时 ， 该 组 数据 中 每 个 变量 值 变 为 原 变量 值 的 2 倍 ， 此 时 数据 的 离散 系 


)。 
.测量 数据 是 否 是 对 称 分 布 的 统计 量 是 ( 。 )。 ,个 > 


a 
E AE bees `= 准 正 态 分 布 ， 则 峰 态 系数 为 


ee s 


二 、 单 项 选择 题 


1 


动情 况 是 ( 


D u 


O Pk O > lk O > Ik O 
l 
$ 


> 


10， 标 准 分 数 的 公式 为 ( 。 )。 M 
变量 值 为 ( 





/ 
` 
一 组 数据 排序 后 ， 处 于 25% OSIS us 
s be 


A. 众 数 B, 上 由 c. FI 
， 一 组 数据 排序 后 ， 处 玉 35 痪 位置 上 所 对 应 的 变量 值 为 (入 
A. 众 数 -BOEMA CSXSE 四 分 位 数 D. 中 位 数 
.8 个 数据 的 平均 数 是 107 其 中 一 个 数 为 6， 那 人 其 余 7 个 数 的 平均 数 是 ( O. 
A. 10.6 一 个 B. 10.2 Xe NO 10.7 D. 10.9 
; "` N 等 ， 其 入 第 和 组 的 样本 方差 为 :=6，s? =8 ， 试 问 两 组 样本 的 波 
J 


D. 中 位 数 








.两 组 波动 情况 相同 B. 第 二 组 比 第 一 组 波动 程度 大 
. 第 一 组 比 第 二 组 波动 程度 大 D. 无 法 比较 
当 一 组 数据 是 左 偏 分 布 时 ， 这 组 数据 的 众 数 、 中 位 数 和 平均 数 的 关系 是 (  ). 
M,=M,=¥ B. x<M,<M, 
M, <M.,<x D. M.<M,<x 
组 数据 是 右 偏 分 布 时 ， 这 组 数据 的 众 数 、 中 位 数 和 平均 数 的 关系 是 ( e 
M,=M,=x B. x<M,<M, 
M, <M.<x D. M.,<M,<x 
数据 是 对 称 分 布 时 ， 这 组 数据 的 众 数 、 中 位 数 和 平均 数 的 关系 是 ( e 
M,=M,=¥ B. x<M,<M, 

. M, <M,<x D. M,<M,<x 
.中 位 数 主 要 适用 于 测量 顺序 数据 的 集中 趋势 ， 但 可 以 测量 ( )e 

A. 分 类 数据 B. 数值 数据 

C. 分 类 数据 和 数值 数据 D. 以 上 都 不 能 


> 








Ki 





T 





9. 如 果 一 个 数据 的 标准 分 数 为 -4， 表 明 数 据 ( 。 )。 
A， 比 平均 数 高 出 4 个 标准 差 
B， 比 平均 数 低 出 4 个 标准 差 
C， 比 平均 数 高 出 4 个 方差 
D， 比 平均 数 低 出 4 个 方差 
10. 比较 两 组 数据 的 离散 程度 采用 的 统计 量 是 ( ). 


A. 方差 B. 标准 差 C. 四 分 位 数 D. 离散 系数 
11. 下列 统 计量 不 受 极端 值 的 影响 的 是 ( 。 )。 

A. 众 数 B. 平均 数 C. 加 权 平 均 数 D. 方差 
12， 比 较 两 组 数据 离散 程度 使 用 离散 系数 ， 其 原因 是 ( — )。 

A， 两 组 数据 的 个 数 不 同 入 

B。 两 组 数据 的 平均 数 不 同 K 


D. 两 组 数据 的 数据 水 平 不 同 或 计量 单位 不 同 
13， 两 组 数据 的 均值 不 等 ， 但 方差 相等 ， 则 离散 程度 ( N 


C. 两 组 数据 的 方差 不 同 S 











A. 均值 大 的 ， 离 散 程度 小 mi a 
C， 两 组 数据 的 离散 程度 相同 „X 法 比较 
14. 下列 指标 受 极端 值 的 影响 的 是 ( 。 )。/ š 
A. hy B. 办 数 QY c 平均 数 D. 四 分 位 数 
a DS 比 平 均 数 ( — )。 
A 高 出 4 个 标准 差 HX B. (G A 
c kustaa Y DE 
多 项 选择 题 T x 
1， 下 列 关 于 众 北 的 叙述 ， 正 确 的 有 ( TE A 
anesan O 
B. 浴 数 主要 适用 于 分 类 数据 的 集中 趋势 度量 ， 也 可 以 测量 顺序 数据 和 数值 数据 


C.。 雁 数 不 受 极端 值 的 影响 

D. 一 组 数据 存在 唯一 的 众 数 

.下 列 有 关 离散 系数 的 叙述 ， 正 确 的 有 ( —)- 

A. 离散 系数 主要 是 比较 多 组 数据 的 离散 程度 

B. 离散 系数 可 以 同时 消除 数据 的 水 平和 计量 单位 对 标准 差 的 影响 
c. 离散 系数 大 的 离散 程度 大 ， 离 散 系数 小 的 离散 程度 小 

D. 离散 系数 大 的 离散 程度 小 ， 离 散 系数 小 的 离散 程度 大 

， 如 果 偏 态 系 数 为 正 值 ， 则 表明 数据 的 分 布 是 (。。)。 


N 


w 


A. 右 偏 的 B. 非 对 称 的 C. 左 偏 的 D. 对 称 的 
4. 异 众 比 率 是 衡量 一 组 数据 的 离散 程度 ， 它 可 以 测量 ( 。 ). 

A. 分 类 数据 B. 顺序 数据 c. 数值 数据 D. 以 上 都 不 可 以 
5. 分 组 数据 计算 平均 数 时 ， 使 用 加 权 平 数 ， 加 权 平均 数 受 (  ) 影 响 。 

A. 频数 B. 组 中 值 C. 最 大 值 D. 最 小 值 


SSE 


务 





统计 学 (C) 理论 与 实 


6. 测量 数值 数据 的 集中 趋势 的 统计 量 有 ( —)- 
A. 众 数 B. 中 位 数 C. 平均 数 D. 以 上 都 不 对 
7. 某 小 区 准备 对 其 服务 采取 新 的 收费 标准 ， 为 此 ， 它 随机 抽取 了 该 小 区 100 户 居民 进行 调查 ， 其 中 
表示 赞成 的 有 23 户 ， 中 立 的 有 20 户 ， 不 赞成 的 有 57 户 ， 试 问 描述 该 组 数据 的 集中 趋势 统计 量 有 ( e 
A. 众 数 B. 中 位 数 C. 平均 数 D. 33: 
8. 下 列 指标 不 受 极端 值 的 影响 的 是 ( — ). 
A. 众 数 B. 中 位 数 C. 平均 数 D. 方差 
四 、 名 词 解释 
众 数 和 中 位 数 。 
简单 平均 数 和 加 权 平均 数 。 
方差 和 标准 差 。 
离散 系数 。 
偏 度 和 峰 度 。 
五 、 计 算 题 


1， 某 班 共有 25 名 学 生 ， 期 末 经 济 学 课程 的 成 绩 分 半分 唱 为 68、73、66、78、86、74、60、89、64、 
90、69、67、76、62、81、63、68、81、81、81 8]、 70¿ 60、87、64。 

试 回答 以 下 问题 : I 

O) 计算 该 组 数据 的 众 数 。 5 I 

(2) 计算 该 组 数据 的 中 位 数 及 四 分 倍数 : XI 

G) 计算 该 组 数据 的 平均 数 和 方差 。 Ú 

(4) 写 出 以 上 3 个 问题 Excel 的 计算 过 程 。 L 

2. 某 班期 末 共 进行 经 济 学 和 统计 学 两 门 课程 的 考试 X 全 班 经 济 学 成 绩 的 平均 分 数 为 80 分 ， 标 准 差 是 
15 分 ， 全 班 统计 学 成 绩 的 乎 均 分 数 为 65 分 ， 标 准 筹 为 3 分。 一 名 学 生 在 经 济 学 成 绩 为 85 分 ， 统 计 学 成 
绩 为 70 分 \* 诚 问 ， 志 治学 生 在 哪 门 课程 的 考试 起 现 理想 ? 

3. OFA 岁 儿童 身高 状况 的 研究 发 现 ， 女 童 的 平均 身高 为 105cm， 标 准 差 为 Sem: 男 童 的 平均 
身高 为 107cm， 标 准 差 为 10cm， 试 回答 以 下 问题 

(1) 女童 和 男 童 身高 差异 哪个 大 ? 为 什么 ? 

(2) 如 果 该 题 的 单位 由 “cm” 转 为 “m”， 女 童 和 男 童 身高 差异 哪个 大 ? 为 什么 ? 

4， 革 企业 生产 日 光 灯 ， 随 机 抽取 了 120 个 日 光 灯 ， 测 得 寿命 数据 如 表 4-7 所 示 ， 试 计算 该 分 组 数据 
的 平均 数 和 标准 差 。 
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表 4-7 ”日光灯 寿命 测试 数据 

















按 寿 命 分 组 频数 
500~1 000 19 
1 000 一 1 500 30 
1 500~2 000 42 
2 000 一 2 500 18 
2 500 以 上 11 
合计 120 





PE 


nn -se AZA 
统计 数据 的 指标 度量 ,ts 
5. 一 种 产品 的 组 装 方法 有 两 种 ， 现 要 从 两 种 方法 中 选 出 一 种 单位 时 间 组 装 产品 最 多 的 方法 ， 随 机 抽 
取 10 个 工人 ， 并 让 他 们 分 别 用 这 两 种 方法 进行 产品 组 装 ， 单 位 时 间 组 装 产品 个 数 数据 如 表 4-8 所 示 。 试 
问 ， 采 用 什么 指标 比较 两 种 组 装 方法 的 离散 程度 ? 如 果 是 你 选择 ， 你 会 选择 哪 种 组 装 方法 ? 


表 4-8 两 种 方法 单位 时 间 内 组 装 产品 个 数 





























方法 1 方法 2 
164 129 
167 125 
170 126 
165 130. 
168 128 
162 127 
160 130 
168 128 
171 127 
165 131 
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第 = 参数 估计 


未 


.掌握 几 个 重要 的 统计 分 布 。 

了 和 解 参数 估计 的 基本 理论 。 2 

.掌握 一 个 总 体 参 数 的 区 间 估 计 。 Ko Y sa 
.掌握 样本 容量 的 确定 。 sS. 


ESAR) 


eN- 


全 校 在 校 六 学 生 每 月 平均 消费 六 出 


为 了 解 全 国 在 校 大 学 生 每 月 平移 消 六 文 出 ， 光华 学 院 经 济 学 各 并 隐 名 本 科 生 对 全 校 部 分 本 科 生 做 了 
问卷 调查 ,调查 的 对 象 为 光华 学 院 在 校本 科 生 ， HENARE EA PH 消费 支出 、 支 出 的 途径 、 支 出 结 
构 等 ， 调 查 问卷 由 调查 员 直 接 到 宿舍 发 放 并 当场 收回 。 Ka 个 件 级 中 每 个 年 级 名 发 放 了 60 份 ， 其 中 男女 
生 各 占 一 半 ， AAE Fa 200 e. 其 中 有 关乎 均 消费 支出 方面 的 数据 整理 见 表 5-1 DR. 


表 5-1 月 平均 消费 支出 调查 数据 整理 表 

















频率 /% 
500 元 以 下 16 
600 一 800 元 40 
800 一 1000 元 27.5 
1 000 元 以 上 16.5 
合计 100 


根据 表 5-1 数据 计算 的 平均 月 消费 支出 为 人 二 749 元 , 试问 全 校 学 生 每 月 平均 消费 支出 是 多 少 ? 作 出 
估计 的 理论 依据 是 什么 ?” 本章 的 内 容 就 将 回答 这 些 问 题 . 


5.1” 几 个 重要 的 统计 分 布 





在 学 习 推 断 统计 的 两 个 方法 ， 即 参数 估计 和 假设 检验 前 ， 必 须要 学 习 统 计 学 中 的 几 个 
重要 的 分 布 ， 因 为 在 参数 估计 和 假设 检验 时 要 用 到 这 几 个 重要 的 分 布 ， 由 于 这 几 个 重要 的 
分 布 ， 在 《概率 与 数理 统计 》 中 已 经 学 习 过 ， 这 里 只 是 简单 地 介绍 一 下 。 
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511 EKS 
定义 5.1 设 随机 变量 X， 如 果 其 概率 密度 函数 为 
-CA 
/0 x? (-<x<o) 
AP, u 为 随机 变量 矶 的 均值 ， 它 可 以 为 任意 的 实数 ;ez 为 随机 变量 X 的 方差 。 则 称 随 
机 变量 XX 服从 正 态 分 布 。 即 表示 为 





X—N(u,o2) G5.D) 
正 态 分 布 是 关于 x= /对 称 分 布 ， 正 态 分 布 中 代表 分 布 的 曲线 扁平 还 是 陡峭 的 ， 当 

其 值 越 小 时 ， 曲 线 越 陡峭 ， 其 值 越 大 时 ， 曲 线 越 扁平 。 正 态 分 布 的 随机 变量 的 线性 组 合 后 

的 随机 变量 也 服从 正 态 分 布 。 

5.1.2 ”标准 正 态 分 布 < 


定义 5.2 标准 正 态 分 布 是 正 态 分 布 的 特例 ， abars A u=0,0=1, MERRE 
机 变量 服从 标准 正 态 分 布 ， 即 












































-No 6D 
此 时 ， 标 准 正 态 分 布 是 关于 y 轴 对 称 分 布 人 e: 
FAEERE ESAR 因此 可 以 将 任何 一 个 服从 一 般 正 态 分 布 的 随机 
EMANU 转换 成 标准 下 春分 有 NOD, HRA ARAN 








1 ` gaT W ` (5.3) 
转换 后 的 Z 是 一 farenin, 
513 EEDA x X > 


从 
DÒ 组 相互 独立 的 随机 变量 XY. X, X, , BR88UBEEE Y —N(0.)) ， 则 随机 

变量 : 
Z => XY m) 64 





式 中 ，n 为 自由 度 。 
ZX 是 由 标准 正 态 分布 的 平方 加 和 得 到 的 随机 变量 ， 所 以 随机 变量 x 为 非 负数 ， 即 
X 三 0; R Z AS EGY i; 



































514 1 分 布 


定义 54 ” 设 有 一 随机 变量 XX 服从 标准 正 态 分布 ， 另 一 随机 变量 Y 服从 x? 分 布 ， 即 
X~N0,), Y~z (n), WE 


t= 





0 (5.5) 
式 中 ，n 为 1 的 自由 度 。 
定义 可 知 ，t 分 布 是 一 个 关于 y 轴 对 称 的 分 布 图 形 。 
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5.1.5 FA 


定义 5.5” 设 有 一 随机 变量 六 服从 妇 分 布 ， 另 一 随机 变量 了 服从 AN, 

X~) Y~n), WA 
Xin 
F= Y/n, ——F(n,.n,) (5.6) 

式 中 ，n 838 BE, n 393 ih, 

由 定义 同样 可 以 得 出 随机 变量 严 是 非 负数 ， 即 已 > 0 ， 非 对 称 分 布 。 

[J 5.1】 随机 变量 1 一 t(n)， 证明 ~~F(1,n) 。 

证 明 : 根据 :~t(n) ， 由 1 分 布 定义 可 知 ， 由 一 个 标准 正 态 分 布 和 二 个 妇 构 造 的 ， 所 以 
设 有 一 随机 变量 服从 标准 正 态 分 布 即 世 ~N(0.D ， 另 一 MURAD HUA z 分 布 ， 即 


















































Y~g (n), WA AS 
m ss 
则 有 NS 
P> S N P 
7 M 


Jepy~ y(n, HEX, 因为 XGORD 3 AXL, MAR 
SAY ` — F0(,n) 


NS A 
、 52 样本 抽样 分 布 “ 
全 XA 


Nme t, 统计 学 主要 是 分 析 数 据 ， 福 泊 数据 的 规律 性 ， 即 得 出 研究 对 象 (总 体 ) 
的 特征 (参数 )， 启 体 的 参数 有 jz,07 。 Piin ， 想 得 出 总 体 的 这 些 参数 ， 需 要 收集 总 体 
的 数据 ， 而 总 体 的 数据 是 不 易 收 集 ， 甚至 是 收集 不 到 的 ， 所 以 只 能 利用 推断 统计 ， 先 来 计 
算 样本 的 统计 量 值 二,p,s*， 推 断 出 总 体 的 参数 ,zx,o?。 那 么 必须 要 学 习 这 种 推断 统计 的 理 
论 依据 ， 即 样本 的 抽样 分 布 。 

定义 5.6 重复 选取 样本 量 为 的 样本 ， 由 该 统计 量 的 所 有 可 能 取 值 形成 的 概率 分 布 ， 
称 为 样本 抽样 分 布 。 

样本 抽样 分 布 指 的 是 样本 的 统计 量 分 布 , 本 书 主要 介绍 样本 均值 x 的 分 布 ,样本 比例 p 
的 分 布 和 样本 方差 ° 的 分 布 ， 因 为 统计 学 最 为 关心 是 总 体 的 均值 、 比 例 和 方差 ， 而 3 个 参 
数 往往 是 利用 推断 统计 ， 从 样本 的 均值 、 比 例 和 方差 进行 估计 的 。 

这 里 需要 注意 的 是 ， 在 实务 中 ， 抽 样 采取 的 是 重复 抽样 ， 所 以 下 面 的 研究 都 是 在 重复 
抽样 的 基础 上 进行 的 。 
5.2.1 样本 均值 的 抽样 分 布 

定义 5.7 重复 选取 样本 量 为 的 样本 ， 由 样本 均值 的 所 有 可 能 取 值 形成 的 概率 分 布 ， 
称 为 样本 均值 的 抽样 分 布 。 
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下 面 以 一 个 简单 的 例子 来 推导 样本 均值 的 抽样 分 布 。 

【 例 52] 设 一 个 总 体 含 有 4 个 元 素 (个 体 )， 即 总 体 元 素 个 数 W=4，4 个 元 素 的 取 值 
分 别 为 w=2、x,=3、 吉 =4、 避 =5。 从 总 体 中 采取 重复 抽样 方法 抽取 样本 量 为 n=2 的 
随机 样本 ， 写 出 样本 均值 xX 的 抽样 分 布 。 

解 ， 从 总 体 分 布 情况 看 ， 总 体 的 分 布 为 均匀 分 布 ， 即 x 取 每 一 个 值 的 概率 都 相同 。 计 




















算 总 体 均值 和 方差 分 别 为 

总 体 均 值 : 

2 ass 

A 
总 体 方差 : 

>- , 

o? =H =—=425 
4 


从 总 体 中 采取 重复 抽样 方法 抽取 样本 量 为 n= 2 的 随机 样本 ， 共 有 16 个 可 能 的 样本 ， 见 
表 5-2 所 示 。 


R52 样本 的 所 有 情况 


























样本 概率 
1 22 2.0 } 1/16 
2 23 25 1/16 
3 2,4 3 1/16 
4 2,5 35 1/16 
5 32 25 1⁄16 
6 3.3 3.0 1/16 
7. 3,4 2a 1/16 
8 35 4.0 1/16 
9 4,2 3.0 1/16 
10 4.3 35 1⁄16 
11 44 4.0 1/16 
12 4,5 4.5 1/16 
13 5,2 35 1⁄16 
14 53 4.0 1/16 
15 5,4 4.5 1/16 
16 55 5.0 1/16 








从 表 5-2 PO 14931, PERSE x ADEA A FLA, HAH 0918238 ri ILK 5-3 
所 示 。 
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表 5-3 样本 均值 的 概率 分 布 























样本 均值 x 概率 
20 1/16 
25 2/16 
3.0 3/16 
3:5 4/16 
4.0 3/16 
45 2/16 
5.0 1/16 





将 样本 均值 的 分 布 绘制 成 图 ， 如 图 5.1 所 示 ， 发 现 样本 均值 于 是 对 称 分 布 。 


由 图 5.1 可 知 ， 样 本 均值 是 关于 均值 3.5 对 称 的 ， 而 总 体 的 均值 也 是 3.5， 所 以 说 样 
本 均值 的 均值 与 总 体 的 均值 相等 。 计 算得 出 样本 的 方差 为 0625， 是 总 体 方差 的 一 半 ， 即 


1/2， 而 2 又 是 样本 容量 ， 所 以 得 出 DGD = 二 ay， gi 
X—N( o) 
n 
样本 的 均值 抽样 分 布 与 原 有 总 体 的 众 布 和 样本 容量 大 小 是 有 关 的 。 
(1) 当 总 体 是 正 态 分 布 时 ， 无 论 样 栗 量 的 大 小 ， 样 本 均值 坟 都 服从 正 态 分 布 。 


中 





4/16 上 
3/16f 
2⁄16[ 
1/16f | | | 
— 
20 30 40 50 样本 均值 


51 样本 均值 分 布 图 


D 当 总 体 是 非 正 态 分 布 时 ， 样 本 量 为 大 样本 时 ， 样 本 均值 x 也 服从 正 态 分 布 。 
(3) 当 总 体 是 非 正 态 分 布 时 ， 样 本 量 为 小 样本 时 ， 样 本 均值 x 不 服从 正 态 分 布 。 

















本 书 只 考虑 前 两 种 情况 ， 即 样本 均值 x 都 服从 正 态 分 布 的 情况 。 
5.2.2 ”样本 比例 的 抽样 分 布 


(5.7) 


经 济 管理 中 ， 经 常 要 使 用 到 比例 ， 如 想 估计 一 批 产 品 的 次 品 率 ， 往 往 要 从 样本 的 比 


B| p 推断 总 体 的 比例 x o 


定义 5.8 总 体 (或 样本 ) 中 具有 某 种 属性 的 单位 数 与 全 部 单位 数 的 比值 ， 称 为 比例 。 


ET 


参数 估计 ii 第. 章 
定义 5.9 重复 选取 样本 量 为 的 样本 ， 由 样本 比例 所 形成 的 所 有 可 能 取 值 概率 分 布 ， 
称 为 样本 比例 的 抽样 分 布 。 
样本 比例 的 抽样 分 布 与 样本 均值 的 研究 方法 相似 ， 本 书 只 考虑 大 样本 的 情况 下 ， 最 后 
推导 出 样本 比例 的 抽样 分 布 为 





p —N(z, 


aSa (5.8) 
n 


5.2.3 ”样本 方差 的 抽样 分 布 


定义 5.10 重复 选取 样本 量 为 的 样本 ， 由 样本 方差 所 有 可 能 取 值 形成 的 概率 分 布 ， 
称 为 样本 方差 的 抽样 分 布 。 







gE D pa- 6.9) 
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证 明 : 





所 以 有 


35:3 


5.3.1 参数 生计 的 各 X] — 


. ya 祖 据 样本 数据 提供 的 信 i 总 体 的 参数 ， 称 为 参数 估计 。 

前 面 读经 介绍 过 参数 是 描述 总 体 特征 的 ， 而 最 关心 总 体 特征 的 有 总 体 均值 ， 总 体 方差 
和 总 体 Wi 如 一 批 灯泡 的 平均 寿命 (总 体 均值 )、 投 资 组 合 的 风险 (总 体 方差 ) 和 一 批 灯泡 的 
次 品 率 (总 体 比例 )。 这 些 总 体 的 特征 往往 是 利用 样本 的 数据 推断 出 来 , 即 通 常用 样本 均值 x 
估计 总 体 均值 jy ; 用 样本 方差 s 估 计 总 体 方差 o*; 用 样本 比例 p 估计 总 体 比例 x 等 。 

































































532 ”参数 估计 的 几 个 基本 概念 

1. 估计 量 与 估计 值 

定义 5.12 ”估计 总 体 参数 0 的 估计 量 的 名 称 ， 称 为 估计 量 ， 用 符号 9 表示 。 

例如 : 样本 均值 xX、 样 本 比例 p 、 样 本 方差 s 等 都 是 一 个 估计 量 。 

定义 5.13 ”估计 总 体 参数 时 计算 出 来 的 估计 量 的 具体 数值 ， 称 为 估计 值 。 

例如 : 要 估计 某 学 院 学 生 考试 的 平均 成 绩 , 这 时 该 学 院 是 研究 的 总 体 , 其 平均 数值 为 
参数 。 随 机 在 该 学 院 抽 取 了 一 个 (班级 ) 样 本 ,该 班级 的 平均 数 x， 根据 这 个 样本 平均 分 数 估 
计 整 个 学 院 的 平均 分 数 ， 所 以 就 是 一 个 估计 量 。 假 定 计 算得 出 样本 平均 分 数 为 80 分 ， 那 
么 这 个 80 分 就 是 估计 量 的 具体 值 ， 称 为 估计 值 。 
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2. 点 估计 与 区 间 估 计 


参数 估计 的 方法 有 点 估计 和 区 间 估 计 
1) 点 估计 
(1) 点 估计 的 定义 。 
定义 5.14 用 样本 统计 量 9 的 某 个 取 值 直接 作为 总 体 参数 0 的 估计 值 ， 称 为 参数 估计 
的 点 估计 。 
例如 ,用 样本 均值 过 直接 作为 总 体 均值 w 的 估计 值 ,用 样本 比例 疡 直接 作为 总 体 比例 地 
4 估计 值 。 用 样本 方差 8 直接 作为 总 体 方差 o 的 估计 值 。 
(2) 点 估计 的 优 缺 点 。 VA 
@ 点 估计 的 优点 。 点 估计 的 计算 较 简单 ， 易 于 理解 。 例如 假定 要 估计 一 批 订 泡 产品 
的 合格 率 ， 从 这 批 灯 泡 中 随机 抽取 20 只 灯泡 ， 如 果 抽 样 结果 合格 率 为 96%， 那 么 将 96% 
直接 作为 这 批 产 品 的 合格 率 的 估计 值 。 <N \ 
@ 点 估计 的 缺点 。 虽然 在 重复 抽样 的 条 件 下 入 计 上 人 可 能 等 到 体 真人 但 
于 样本 是 随机 的 ， 因 此 抽出 - -个 具体 的 样本 所 得 刘 侈 俩 计 值 很 可 能 不 同 于 总 体 真 值 ， 即 表 
明 一 个 具体 的 点 估计 值 无 法 给 出 点 估计 的 可 和 ,因此 不 能 完全 依赖 于 - -个 点 估计 值 ， 而 
是 应 该 围绕 点 估计 值 构造 出 总 体 参数 的 < 个 区 间 ， 即 区 间 估 计 。 































































































2) 区 间 估计 SS N. 5 
定义 5.15 在 点 估计 全 的 革 础 上 给 出 总 体 参数 估计 的 | 个 范围 ， 秘 为 参数 的 区 各 
估计 。 x KX Xx f Kë 


例如 ， 一 名 高 考 学 生 在 考 完 英语 后 ， 估 计 自己 的 设 绩 估计 的 成 果 为 90%6 的 概率 ， 成 
绩 为 120 一 130 Jy, 这 个 估计 就 是 区 间 估 计 #_ 其 概率 的 表达 形式 为 p(120<X<130)=90%， 
即 该 名 学 生 的 英语 碱 绩 是 未 知 参数 ， 这 个 来 知 参数 有 90% 的 概率 为 120 一 130。 同 时 也 表明 
让 人 以 某 神 程度 上 确信 这 个 区 间 会 包 真 正 的 总 体 参 数 ， 所 以 给 它 取 名 为 置信 区 间 。 

定义 5.16 由 样本 统计 量 所 构造 的 总 体 参数 的 估计 区 间 ， 称 为 置信 区 间 ， 其 中 区 间 的 
最 小 值 称 为 置信 下 限 ， 最 大 值 称 为 置信 上 限 。 

其 中 置信 区 间 是 在 以 概率 为 90% 的 水 平 存在 ， 这 里 的 概率 取 名 为 置信 水 平 。 

定义 5.17 ”如 果 将 构造 置信 区 间 的 步骤 重复 多 次 ， 那 么 区 间 中 包含 总 体 参 数 真 值 的 次 
数 所 占 的 比率 ， 称 为 置信 水 平 。 

在 构造 置信 区 间 时 ， 可 以 用 所 希望 的 任意 值 作为 置信 水 平 。 但 通常 情况 下 ， 置 信 水 
H 90%、95% 和 99%. 

3. 标准 误差 

定义 5.18 样本 统计 量 的 抽样 分 布 的 标准 差 ， 称 为 统计 量 的 标准 误差 。 标 准 误差 是 衡 
量 统计 量 的 离散 程度 的 。 
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在 参数 估计 中 , 一 般 是 用 样本 估计 量 6 作为 总 体 参数 0 的 估计 。 实际 上 , 用 于 估计 9 的 
估计 量 有 很 多 ， 如 可 以 用 样本 均值 作为 总 体 均值 的 估计 量 ， 也 可 以 用 样本 中 位 数 作为 总 体 
均值 的 估计 量 等 。 那 么 ， 究 竟 用 样本 的 哪 种 估计 量 作为 总 体 参 数 的 估计 呢 ? 自然 要 用 估计 
效果 最 好 的 哪 种 估计 量 。 什 么 样 的 估计 量 才 算 是 一 个 好 的 估计 量 呢 ? 这 就 需要 有 一 定 的 评 
价 标准 。 评 价 估计 量 的 标准 ， 主 要 有 以 下 几 个 。 

1. 无 偏 性 


定义 5.19 估计 量 抽样 分 布 的 数学 期 望 等 于 被 估计 的 总 体 参数 ” 称 为 无 偏 性 。 即 设 总 
体 参数 为 0 ， 所 选择 的 估计 量 为 ， 如 果 E(B)=0 ， 则 称 为 6 的 无 偏 佑 计量 。 

通常 用 样本 均值 估计 总 体 均值 ; WAP e ñH 00k Dye e°, 样本 比例 tii 
I nn i DD 方差 是 总 体 方差 0 的 无 
偏 估计 ; 样本 比例 是 总 体 比例 的 无 偏 估计 E 样 分 布 时 ， 曾 经 提 到 EE) = uA 
E(p)=x， 同 样 可 以 证 明 E(s2)= o? \ 


AXN 
WE: E(2)=o2, AK 










































































2 s š K: | a 


入 = 二 Ls — 2xnx + nx?) 


二 
pla —nx2)= o° 


注意 : 一 个 参数 的 无 偏 估计 量 并 不 是 唯一 的 ， 如 式 = 


X, + x, +: + X, 和 
n 
aX, + a,x, +-** + a,x, 


= (JE P a0) 都 是 总 体 均值 1 的 无 偏 估 计量 。 前 面 已 经 得 出 


M+ +t, 
E(¥)=u, N] E(¥')= yp itAk F: 


= 





EG) = EEA an t'a, = > Elax) 
a +a, += +a, Xa 
_2Zazc) Pan 
Da Xa 
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2. 有 效 性 
于 一 个 参数 的 无 偏 估计 并 不 是 唯一 的 ， 要 想 得 出 参数 的 最 好 估计 量 ， 就 要 看 估计 量 
与 参数 的 离散 程度 ， 即 一 个 无 偏 的 估计 量 并 不 意味 着 它 就 非常 接近 被 估计 的 参数 ， 它 还 必 
须 与 总 体 参数 的 离散 程度 比较 小 。 也 就 是 说 ， 在 无 偏 估计 的 条 件 下 ， 估 计量 的 方差 越 小 
估计 就 越 有 效 。 

定义 5.20 ”对 同一 个 总 体 的 两 个 无 偏 估 计量 入 和 包 ， 若 D(O) < D(6.) ， 则 称 包 是 比 
ô 更 有 效 的 一 个 估计 量 。 

证 明 : 总 体 均值 w 的 两 个 无 偏 估计 量 过 和 也 xx EAA. 


X, + X, +--- + X, 


本 X 























D(x)= D(. 


ü 





其 中 x 
GY ) l: +2aa, +2aa, x pa 
> w +2a,a, + 2a, a, +` “+ 200, 
> +2a,a, + ¥2a d 
SS b> 
< < 
NO +2a, a, | 


4 2 
又 有 24aa, Sa? +a, 


所 以 (六 oj 和 zw， > 


Sa” > yY 更 有 效 。 





aka 


3. 一 致 性 

定义 5.21 随 着 样本 容量 的 增 大 ， 点 估计 量 的 值 越 来 越 接近 被 估计 总 体 的 参数 ， 称 为 
一 致 性 。 

例如 , 研究 估计 某 个 班级 统计 成 绩 的 方差 , 该 研究 总 体 是 这 个 班级 , 共有 人 数 为 50 Ao 
分 别 让 4 个 不 同 的 研究 人 员 去 估计 ， 估 计 的 结果 如 下 。 

第 1 个 人 ， 随 机 抽取 了 20 人， 得 出 的 方差 为 5.6。 

第 2 个 人 ， 随 机 抽取 了 26 人 ， 得 出 的 方差 为 4.9。 

第 3 个人， 随机 抽取 了 30 人 ， 得 出 的 方差 为 5.5。 





EW 


satt amaS 








第 4 个 人 ， 由 于 手中 掌握 更 多 的 数据 ， 随 机 抽取 了 48 人 ， 得 出 的 方差 为 5.2。 

试问 ， 哪 个 人 得 出 的 估计 值 最 接近 被 估计 的 总 体 参数 ? 答案 是 第 4 个 人 得 出 的 估计 值 
最 接近 总 体 的 参数 方差 。 因 为 他 抽取 的 样本 最 大 。 
534 ”参数 估计 的 思路 


前 面 已 经 介绍 过 一 个 具体 的 点 估计 值 无 法 给 出 点 估计 的 可 靠 性 ， 因 此 不 能 完全 依赖 于 
一 个 点 估计 值 ， 而 是 应 该 围绕 点 估计 值 构造 出 总 体 参数 的 一 个 区 间 ， 即 区 间 估计 ， 而 区 间 
估计 推断 出 总 体 的 参数 jx,azp 的 范围 理论 依据 是 样本 的 抽样 分 布 .所 以 ,估计 总 体 均值 
ie Ap ana 
总 体 比例 要 从 样本 比例 p 的 抽样 分 布 入 手 。 
区 间 估计 就 是 在 一 ne 得 出 总 体 参 数 的 置信 区 间 。 曾 经 在 概率 中 学 习 过 
当 一 个 统计 量 服从 标准 正 态 分 布 、 Z 分、 r 分布 和 尺 分 布 时 ， 可 以 查 表 得 出 该 统计 量 小 
— 5, 相反 ,给 个 概率 ， ne BEME, BI P(X < x). AH 

LABIA MAA BABERE P 同样 ， 先 给 出 概率 P， 可 以 由 
随机 变量 的 分 布 表 得 出 x 数值 。 

根据 以 上 方法 ， ea ee 
布 入 竹 ， 同 时 把 抽样 分 布 用 各 种 方法 使 其 服从 标准 正 态 分 人 
种 分 布 之 一 。 Wn A 


Xaa 一 个 人 区 站 


A U. V sa 

541 ”总体 均值 的 区 间 估 计 

对 总 体 均值 进行 区 间 估计 时 ， 需 要 考虑 总 体 是 否 为 正 态 总 体 、 总 体 方差 是 否 已 知 、 
于 构造 估计 量 的 样本 是 大 样本 还 是 小 样本 等 几 种 情况 。 

L 正 态 总 体 、 方 差 已 知 ， 或 非 正 态 总 体 、 大 样本 

当 总 体 服从 正 态 分 布 且 o 已 知 ， 或 者 总 体 不 是 正 态 分 布 但 为 大 样本 时 ， 样 本 均值 ?的 
抽样 分 布 均 为 正 态 分 布 ， 其 数学 期 望 为 总 体 均值 人 ， 方 差 为 a*， 即 区 -NU 。 样本 
均值 经 过 标准 化 以 后 的 随机 变量 服从 标准 正 态 分布 ， 即 

z= eNi; 1) 


al 











































































































在 置信 水 平 1-w 有 





P(aS<S Z<b)=1-a 
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根据 标准 正 态 分 布 的 性 质 可 得 出 


























l-a 
z a 本 
Za | Za 
Bla=-Z,, b=Z,,, MUR -Za S Z<Zz,,, NAJ Z-A £ Z f FN 
NGN 
F ez 12 

r. SZ NÒ 

由 于 总 体 方差 是 已 知 的 ， 分 母 乘 到 两 边 ， 得 / 








-Za/W <x- ,0 Vn 
上 式 中 ， 样 本 均值 x 可 以 利用 样本 数据 计算 : N 以 由 上 式 可 以 得 到 总 体 均值 w， 即 区 
间 范 围 如 下 : a IN 


SZ EESAN o/Vn (5.10) 


或 者 写成 : 
` 
shinan ahi xP 


RP, T-Z, o/ n 称 为 置信 下 限 ， 区 + 乙 TUNA “Aa 1-a 称 为 置信 水 平 ，w 
是 事先 所 确定 的 一 个 概率 值 ， 也 被 称 为 风险 什 司 体 均值 不 包括 在 置信 区 间 的 概率 ; 
Zs 是 标准 正 态 分 布 上 侧面 积 为 Z。 ,时 KANY o s RIIE ARARA, 
BENRA G. AED, T RAKKAR: H 
述 估计 量 精 度 的 误差 值 ， 该 值 称 为 边际 误差 。 

2. 正 态 总 体 、 方 差 未 知 ， 或 非 正 态 总 体 ， 但 样本 是 大 样本 

1) 区 间 估 计 

如 果 总 体 服从 正 态 分 布 且 oa 未 知 ， 或 总 体 并 不 服从 正 态 分 布 ， 但 只 要 是 在 大 样本 条 件 
下 ， 样 本 均值 了 同样 服从 正 态 分 布 ， 即 了 -NU ， 经 过 标准 化 以 后 的 随机 变量 还 是 服 


从 标准 正 态 分 布 ， 即 









































£ —_N(0. 1) 


e 

但 此 时 的 标准 正 态 分 布 的 统计 量 中 包含 了 两 个 未 知 参数 (4 和 o)， 所 以 无 法 求 出 4 的 
区 间 ， 但 由 于 样本 是 大 样本 ， 前 面 学 习 过 一 致 性 ， 随 着 样本 容量 的 不 断 增加 ， 样 本 所 计 
算出 的 样本 统计 量 非 常 接近 于 总 体 参 数 ， 所 以 这 时 可 以 用 样本 方差 代替 总 体 方差 。 
所 以 有 
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sn 
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在 置信 水 平 1-x 有 
P(a< Z<b)=1—-G@ 





根据 标准 正 态 分 布 的 性 质 可 得 出 


2 al: 


= | =< ~ O 


Bla=-Z , b=Z,,+ MAA -Zan S Z< Z;,,,, XA K ， 有 下 式 成 立 : 
2 


£ 
eee 
由 于 总 体 方差 是 已 知 的 ， 分 母 乘 到 两 边 ， 


i 9 s/n 











Zan <Z 











上 式 中 ， 样 本 均值 x E. > 来 ， E uta awkak, 即 区 
间 范 围 如 下 : 

ly ee (5.11) 
或 者 写成 a 

Rae X+Z aan 


RP, -Z pnma FIR, "op 称 为 置信 上 限 ， 这 时 zy 是 估计 总 
体 均 值 让 

2) Excel — a 

利用 Excel 中 的 NORMSINV 函数 可 以 计算 给 定 置信 水 平 下 的 正 态 分 布 的 分 位 数值 .在 
95% 的 置信 水 平 下 ， 相 应 的 a/2=0.025 。 求 2Z, ,的 具体 步 又 如 下 。 

第 一 步 : 进入 Excel 表格 界面 ， 单 击 “ 插 入 函数 ”按钮 ， 弹 出 “插入 函数 ”对 话 框 ， 
在 对 话 框 中 单 击 “ 或 选择 类 别 ” 的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 中 选择 “统计 ”选项 ， 并 
在 “选择 函数 ”列表 中 选择 NORM.S.INV 选项 ， 单 击 “ 确 定 ” 按 钮 ， 弹 出 “函数 参数 ”对 
话 框 。 

第 二 步 :在 “函数 参数 ”对 话 框 中 的 Probability 文本 框 中 输入 “0.025”, 得 到 “-1.95996”。 

3. 正 态 总 体 、 方 差 未 知 ， 样 本 是 小 样本 


1) 区 间 估 计 

如 果 总 体 方差 已 知 ， 而 且 是 在 小 样本 的 情况 下 ， 也 可 以 用 样本 方差 代替 o?， 但 
此 时 样本 样本 均值 经 过 标准 化 以 后 的 随机 变量 服从 自由 度 为 (x-1) 的 1 分 布 ， 其 过 程 如 下 。 

当 总 体 服从 正 态 分布 ， 无 论 大 小 样本 ,样本 均值 的 抽样 分 布 均 为 正 态 分布 ， 即 
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NO oa”)。 样 本 均值 经 过 标准 化 以 后 的 随机 变量 服从 标准 正 态 分 布 : 





£ ~N(0, 1) 


z-i 
此 时 该 统计 量 中 包含 了 两 个 未 知 参数 (w Mo) MAKERE uK. LEMMER, + 
能 直接 用 样本 方差 s* 代 蔡 o*， 此 时 从 标准 正 态 无 法 得 出 总 体 j 的 区 间 估 计 。 若 用 x 分 布 ， 
L 是 标准 正 态 分 布 的 平方 加 和 ， 经 过 平方 加 和 后 ， 其 式 中 还 有 两 个 未 知 参数 (4 Mlo), M 
是 不 可 以 。 此 时 可 用 1 分 布 。 同 时 有 



























































-Ds Ds me tn 1) 
所 以 有 > 
一 一 一 上 (2 一 ]) 
E /(n-1) NÀ 
把 上 两 式 代 入 得 到 : , 








` 
整理 后 ， 得 到 下 式 : DAN ~ 
人 > 


在 置信 水 平 1-c 有 XK ,WW 
> s Ps ar 
根据 标准 正 态 咎 布 的 性 质 可 得 出 . 324 
J 























l-a 
a2 al: be 
-aorD | taln) 
B a=- a(n); b=t,(n-1, MAF pa (0-1) StSt, (0-1); 又 因为 上 = 三 有 
J 
FARY: 
-t a(n- S12% E <, (0-1 
tan (n—1) S t= PA tan (n—-1) 
经 整理 ， 得 到 总 体 均 值 的 区 间 ， 即 区 间 范 围 如 下 : 
F-t,a(n-1)s/Vn nuitts(n-D)s/Vn (5.12) 


EY 


参数 估计 ,ss: 第 .2 章 
或 者 写成 : 
Ft, s(n-1)s/Vn 
RP, ta (n-1)s/vVn 为 估计 总 体 均值 时 的 边际 误差 。 
2) Excel 中 的 统计 函数 
利用 Excel 中 的 TINV 函数 可 以 计算 给 定 置信 水 平 下 的 1 分 布 的 临界 值 。 设 自由 度 
df =15 ， 在 95% 的 置信 水 平 下 ， 相 应 的 ga/2=0.025 。 求 得 具体 步骤 如 下 。 
第 一 步 : 进入 Excel 表格 界面 ， 单 击 “ 插 入 函数 ”按钮 ， 弹 出 “插入 函数 ”对 话 框 ， 
在 对 话 框 中 单 击 “ 或 选择 类 别 ” 的 下 拉 按钮 ， 在 弹出 的 下 拉 列 表 中 选择 “统计 ”选项 ， 并 
在 “选择 函数 ”列表 中 选择 TINV 选项 ， 单 击 “ 确 定 ” 按 钮 ， 弹 出 “函数 参数 ”对 话 框 。 
第 二 步 : 在 “函数 参数 "对话 框 中 的 Probability 文本 框 中 输入 40.05”, 在 Deg_freedom 
文本 框 中 输入 “15” 该 函数 自动 返回 Z, ,的 值 为 “2.131449536”。™% ` 
将 以 上 总 体 均 值 的 区 间 估 计 进 行 总 结 ， 见 表 5-4 所 示 。 
表 5-4 ”不 同情 况 下 总 体 均值 的 区 间 个 计 


EEA 样本 容量 a 未 知 
KEKO >30) ENP 
EASi = = 
小 样本 (n S30) IEP 
非 正 态 分 布 大 样本 (n>>30 2 


【 例 5.3] 一 家 馈 装 饮料 旨 产 企业 ， 要 求 每 钢 的 平均 容量 为 -255 mL， 标 准 差 为 SmL， 
为 了 对 产品 质量 进行 监测 * 从 某 天 生产 的 一 批 产品 中 陵 机 抽取 40 铅 进 行 研究 , 测 得 每 钢 的 
平均 容量 为 255.9 mL. ` 已 知 产品 容量 的 分 布 服从 正 态 分 布 。 试 估计 该 批 产 品 平均 重量 的 置 
售 区 间 ， 置 信 水 平 为 95%。 i 

解 : 已 知 总 体 的 标准 差 c=5， 所 以 无 论 样 本 为 大 小 样本 ， 对 总 体 均 值 进行 区 间 估 计 ， 
使 用 式 (3.10)2 






























































x-2Zn0/ n< <x+Z,,oÍ n 
其 中 n=40， 置 信 水 平 为 1- a = 95% ， 查 标准 正 态 分 布 表 得 2Z,,, =1.96， 同 时 及 =255.9。 
所 以 有 
5 
v40 


254.4 < u < 257.4 
【 例 5.4】 RERA EEE EER t A BJ 623068, MATE AER RA 





255.9 +1.96 x 








收集 到 由 36 位 投保 人 组 成 的 随机 样本 ， 得 到 每 位 被 保险 人 的 年 龄 数据 ， 见 表 5-5 所 示 。 
表 5-5 36 位 被 保险 人 的 年 龄 
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试 建立 被 保险 人 年 龄 99% 的 置信 区 间 。 
解 : 根据 题 意 ， 总 体 方差 未 知 ， 但 n=36 为 大 样本 ， 要 估计 总 体 均 值 的 区 间 ， 所 以 使 
式 (5.11): 




















_ Z, ,s/n < a< x+Z,,sÍ Jn 
根据 样本 的 数据 ， 计 算 样本 的 均值 和 样本 方差 如 下 : 
-2 - z364 ss SED 7 
mE 


置信 水 平 为 1-w=99% , 在 标 准 正 态 分 布 表 得 Z, =2.58 。 








所 以 有 A 
36.4+2.58x 114 ES” 
V36 SN 


KAN 
A X 


33.33 < u < 39.47, <\ 

【 例 5.5】 一 家 食品 生产 企业 以 生产 袋 装 食品 为 主 ， 入 天 产量 大 约 为 8000 48, 按 规 定 ， 
每 袋 食 品 的 重量 应 为 100g。 为 对 产品 质量 进行 监测 丛 业 质 检 部 经 常 要 进行 抽检 ， 以 分 析 
每 袋 重 量 是 否 符合 要 求 。 现 从 某 天 生 Poem 5 8, 测 得 每 袋 重 量 见 
表 5-6 所 示 。 







、25 袋 食品 的 重量 


| wo | oso | o | 10s | 026 | 07s | oso | 

| 

| oso | wes | 1s | is [| sa | ssl — | 
EAI AT ANE OKI Sam 产品 平均 重量 的 置信 区 间 ， 置 信 水 平 
为 95%。 ANY 

解 ， 总 条 方差 未 知 ， 置 信 水 平 1-w=95% ， 查 标准 正 态 分 布 表 得 4,(24) = 2.39 。 根 据 
样本 数据 计算 的 样本 均值 和 样本 标准 差 为 


>x = 
Ei sa s SD J531 =9.76 
n 25 n—l 


根据 式 (5.12) 得 : 





EE 
` 单位 ，g 





F 











-pa-Ds/ < u< F +t, (n-1)s/ Jn 
9.76 
V25 


105.36+2.39x 











最 后 的 区 间 范 围 为 











100.69 < < 110.03 








5.4.2 ”总 体 比例 的 区 间 估 计 
本 节 只 讨论 大 样本 情况 下 总 体 比 例 的 估计 问题 ， 当 样本 容量 足够 大 时 ， 比 例 p 的 抽样 
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Smit anaa 
分 布 可 用 正 态 分 布 近似 ， 即 
p~n, ZE) 
n 
样本 比例 经 标准 化 以 后 的 随机 变量 服从 标准 正 态 分 布 ， 即 
=—P ~N(0,1) 
al-z) 
n 
与 总 体 均值 的 区 间 估 计 类 似 ， 在 置信 水 平 1-w 有 
P(a<SZ<b)=1-a 
Bla=-Z,, b=Z,,,; MAR -Zy z, > XAK z= ， 有 下 式 成 立 : 








We 2 I a= 


n 














又 因为 是 大 样本 ， 所 以 用 样本 的 统计 量 p 代 蔡 两 边 的 x ， 得 到 区 间 范 围 如 下 : 














A PCP) < 2 p Z. | 加 -号 (5.13) 
n n 


或 者 写成 : 


其 中 Ze 





【 例 5.6】 某 城市 想 要 估计 下 岗 职工 中 女性 所 占 的 比例 ， 所 以 随机 抽取 了 1 000 个 下 岗 


PU-P) 是 估计 总 体 比例 时 的 边际 误差 




















职工 ， 其 中 650 人 为 女性 职工 。 试 以 90% 的 置信 水 平 估计 该 城市 下 岗 职工 中 女性 比例 的 置 














信 区 间 。 
f: 已 知 n=1 000， 置 信 水 平 1-w =90% ， 查 标准 正 态 分 布 表 得 Z,,, =1.645 。 根 据 样 
本 数据 计算 的 样本 比例 为 
Be 
1000 


SSE 


mpo 


根据 式 (5.13) 得 : 
pZ, [PCP -65% +1.96x 65% x (165%) 
RRN e - 1000 


即 65% + 1.5% = (63.5%,66.5%) 。 
543 ”总 体 方差 的 区 间 估 计 

1. 区 间 估 计 

本 节 只 讨论 正 态 总 体 方差 的 区 间 估 计 问 题 .构造 总 体 方差 的 区 间 估 计 , 要 从 样本 方差 5 
入 手 ， 由 于 样本 方差 -~ (nD)， 因此 用 妇 分 布 构造 总 体 方差 的 置信 区 间 。 























i (n—1)s° 


ka. K 

dk 
NN 

RY 





在 置信 水 平 1-x 有 








所 有 ， x< 


<< É 
eN — (n), FETA —3RfCB 2, 于 是 有 


n-—1)s? 
< Dr < a 
Fa 












































Yan(n—l) < ZL (n-D 


最 后 可 以 推导 出 总 体 方差 在 1-a 置信 水 平 下 的 置信 区 间 为 
(n-1)s? zs (n-1)s?° 
Xan(n-l) Z (n— l) 








(5.14) 


2. Excel 中 的 统计 函数 

利用 Excel 中 的 CHIINV 函数 可 以 计算 给 定 置信 水 平 下 的 好 分 布 的 分 位 数值 。 设 自 
度 df =24， 在 95% 的 置信 水 平 下 ， 相 应 的 a/2=0.025。 求 z a 的 具体 步骤 如 下 。 

第 一 步 : 进入 Excel 表格 界面 ， 单 击 “ 插 入 函数 ”按钮 ， 弹 出 “插入 函数 ”对 话 框 ， 
在 对 话 框 中 单 击 “ 或 选择 类 别 ” 的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 中 选择 “统计 ”选项 ， 
并 在 “选择 函数 ”列表 中 选择 CHIINV 选项 ， 单 击 “ 确 定 ”按钮 ， 弹 出 “函数 参数 ”对 
话 框 。 

第 二 步 : 在 “函数 参数 ”对 话 框 中 的 Probability 文本 框 中 输入 “0.025”, 在 Deg_freedom 


EW 





















































emt a 89 8 





文本 框 中 输入 “24”, 该 函数 自动 返回 z”, , 的 值 为 “39.36407706”。 同样 可 得 到 2a =0.975 
的 值 为 “12.40115026 ”。 

【 例 5.7] 仍 利用 例 5.5 的 数据 ， 以 95% 的 置信 水 平 建立 该 种 食品 对 
区 间 。 


解 : 已 知 根据 样本 的 数据 计算 出 s= Ze — -5531-976 ， 置 信 水 平 





























二 








要 的 方差 的 置信 








1-w =95% ， 则 查 表 可 得 : 
X007s(24) =12.401 15 
uns(24) =39.364 08 


Ds Ds K 
Z n (n-1) Zanln- K 
24x9.76° — 2 <2 .76 
= 
39.364 08 Ka 9 
58.08 < o° A 


5.5 kinaz 








在 进行 参数 估计 之 前 ， ASD naamani Janena rrn 
样本 来 估计 总 体 参数 。 在 家 和 六 区 间 售 计时 ，- es 估计 的 可 靠 程度 ， 二 是 提高 
区 间 估 计 的 精确 性 。 实 征 梯 本 容量 一 定时 ， 两 者 往往 是 对 六 的， 

例如 ， 要 说 肌 琳 一 天 会 下 两 ， 置 信 区 阅 并 不 千 但 是 可 靠 性 相对 较 低 ， 如 果 说 第 三 季 
度 会 下 - ee 但 准确 性 又 开关 = 也 就 是 置信 区 间 太 宽 的 估计 是 没有 意义 的 。 





如 果 既 想 信 区 间 ， 又 不 想 降低 置信 程度 ， 就 需要 增加 样本 容量 ， 但 样本 容量 的 增加 
也 会 受到 许多 限制 ， 如 会 增加 调查 的 费用 和 工作 量 。 通 常 来 说 ， 样 本 容量 的 确定 与 可 容忍 
的 置信 区 间 的 宽度 及 对 此 区 间 设 置 的 置信 水 平 有 一 定 关系 。 因 此 ， 如 何 确定 一 个 适当 的 样 
本 容量 ， 也 是 抽样 估计 中 需要 考虑 的 问题 。 


5.5.1 ”估计 总 体 均值 时 样本 容量 的 确定 


如 前 所 述 ， 总 体 均 值 的 置信 区 间 是 由 样本 均值 和 边际 误差 两 部 分 组 成 。 
1. 总 体 方差 已 知 
在 重复 抽样 或 无 限 总 体 抽样 的 条 件 下 ， 总 体 方差 是 已 知 时 ， 边 际 误差 为 2Z,,,o/Vn 。 
2 的 值 和 样本 容量 n 共同 确定 了 边际 误差 的 大 小 。 也 就 是 说 , 一 旦 确定 了 置信 水 平 1-w ， 
IWA Zan 的 值 就 确定 了 。 根 据 给 定 的 Z., 的 值 和 总 体 标 准 差 c ， 就 可 以 确定 任 一 希望 的 边 
际 误差 内 所 需要 的 样本 容量 。 令 EE 代表 希望 达到 的 边际 误差 ， 即 
Zuo/Nn<E 
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此 可 以 推导 出 确定 样本 容量 的 公式 为 
KOMA 
n> (5.15) 























2. 总 体 方差 未 知 ， 大 样本 
相同 的 原理 ， 当 总 体 方差 未 知 时 ， 大 样本 时 ， 可 得 出 样本 容量 的 公式 为 


n> —_— i (5.16) 
3. 总 体 方差 未 知 ， 小 样本 
总 体 方差 未 知 ， 小 样本 时 ， 样 本 容量 的 公式 为 N 
n> Ba < i 


从 上 面 几 个 公式 可 以 看 出 ， RERESENKF n o A 
置信 水 平 越 大 ， 所 需 的 样本 容量 也 越 大 ; t FERRER :成 正比 ， 总 体 的 差异 越 大 ， 
所 要 求 的 样本 容量 也 越 大 ; re 反比 ， 即 可 以 接受 的 边际 误差 的 
平方 越 大 ， 所 需 的 样本 容量 就 越 小 。 


注意 : 计算 出 的 样本 容量 不 一 NS en ` 的 整数 ， 也 就 是 








将 小 数 点 "Sus: 39 25.68 取 26, 25.01 也 取 26， 即 这 就 是 样本 容量 
的 圆 整 法 则 。 


【 例 5.81 CORE 根据 过 去 的 经 验 ， 标准 
差 为 120 元 ， WERE 90% 的 置信 水 平 估计 每 均 购 物 金额 的 置信 区 间 ， 并 要 求 边 
际 误差 不 超过 20 元， 上 最 少 抽取 多 少 个 顾 客 作为 K? 
解 : Kygo 想 要 估计 总 体 均 S 是 已 知 ， 所 以 使 用 式 (5.15)， 有 
2 nz - 地 a Weissi _ yen 97.4169 
即 最 少 要 抽取 98 个 顾客 作为 样本 。 


5.52 ”估计 总 体 比例 时 样本 容量 的 确定 
与 估计 总 体 均值 时 样本 容量 的 确定 方法 类 似 ， 在 重复 抽样 或 无 限 总 体 抽样 的 条 件 下 
估计 总 体 比例 是 信 区 间 的 边际 误差 为 Z. , 2022, 



































Zz al-z) 
n 
此 可 以 推导 出 重复 抽样 或 无 限 总 体 抽样 条 件 下 确定 样本 容量 的 公式 为 
>, nY al-z) 
E? 
在 实际 应 用 中 ， 如 果 不 知道 x 的 值 ， 可 以 通过 类 似 的 样本 比例 来 代 蔡 。 
【 例 5.9】 根据 以 往 的 生产 统计 ， 某 产品 的 合格 率 约 为 95%， 现 要 求 边际 误差 为 4%， 


‘EW 


<E 























(5.18) 

















参数 估计 ,nt 


在 求 90% 的 置信 区 间 时 ， 应 最 少 抽取 多 少 个 产品 作为 样本 ? 





M: 已 知 r=95% ， 巨 =4% ，Z ,=1.645， 根 据 式 (5.17) 得 : 
Z, x(n) _ (1.645)’ x0.95x(1 -0.95) _80335 


n= ( 
E 0.04 





即 应 最 少 抽取 81 个 产品 作为 样本 。 


=y 


称 为 


为 ( 


为 


习 题 


填空 题 


. 样本 抽样 分 布 是 指 样本 的 ( 。 ) 分 布 。 K 
, 当 总 体 是 正 态 分 布 时 ， 无 论 样 本 量 的 大 小 ， 样 本 均值 都 服从 (; <。 
Te 
. 估计 总 体 参数 9 的 统计 量 的 名 称 ， 称 为 ( — )。 N 

ETERU o nu26e kunam CANN 

. 用 样本 统计 量 Ô 的 某 个 取 值 直接 作为 总 体 参 a ， 称 为 参数 的 (  ). 

. 在 点 估计 值 的 基础 上 ， 给 出 总 体 参数 估计 的 [ 浆 范围 ， 称 为 参数 的 (  ). 
te )， 其 中 区 间 的 最 小 值 称 为 ( ) BKN 


ow- 





( 


2 


)e A 
A 那么 区 间 中 包含 4 称 
) VN AX 


10. 评价 估计 量 的 标准 有 CC O. O. yA 
nD UNNA )- 
12, 当 剖 体 服从 正太 分布 且 已 知 ， 或 者 总 体 不 是 正 态 分 布 但 为 大 样本 时 ， 样 本 均值 的 抽样 分 布 均 
y. < x. 

13.4 > 

14 总 伟 凑 产 的 置信 区 间 是 由 样本 统计 量 的 (。 ) 减 ( — ) 得 到 的 。 














15. 其 他 条 件 不 变 的 情况 下 ，90% 的 置信 区 间 比 95% 的 置信 区 间 ( — )。 
单项 选择 题 
1. 当 总 体 是 非 正 态 分 布 ， 样 本 容量 为 大 样本 时 ， 样 本 均值 服从 ( )o 

A. 正 态 分 布 B. 标准 正 态 分 布 C. 1 分 布 D. z hti 
2. 当 样 本 均值 x 的 抽样 分 布 服从 正 态 分 布 时 ， 其 分 布 的 均值 为 (。 “)。 

A. x B. ujn C. u D. o°fn 
3. 当 样 本 均值 的 抽样 分 布 服 从 正 态 分 布 时 ， 其 分 布 的 方差 为 ( e 

A. ca/ B. o'/ Jn C. ujn D. o°fn 
4. 在 大 样本 的 情况 下 ， 可 推倒 出 样本 比例 p 的 抽样 分 布 为 ( )e 

A. 正 态 分 布 B. 标准 正 态 分 布 C. 1 分 布 D. Z rfi 
5. 在 大 样本 的 情况 下 ， 在 重复 抽样 条 件 下 ， 样 本 比例 分 布 的 方差 为 ( 。 )。 

A w B. 1-7 C. l-7) D. al- r)/n 
6. 样本 方差 所 有 可 能 取 值 形成 的 概率 分 布 为 ( )- 

A. 正太 分布 B. 标准 正 态 分 布 C. 1 分 布 D. x 分 布 
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7. 统计 量 的 标准 误差 是 指 ( )- 
A. 样本 观测 值 的 标准 差 B. 总 体 观测 值 的 标准 差 
C. 样本 统计 量 抽样 分 布 的 标准 差 D. 总 体 统计 量 的 标准 差 
8. 下 列 说 法 中 不 正确 的 是 (  ). 
A. 样本 均值 是 总 体 均值 的 点 估计 
B. 样本 比例 是 总 体 比例 的 点 估计 
C. 如 果 抽 样 分 布 的 均值 等 于 总 体 参数 ， 则 该 统计 量 称 作 参 数 的 无 偏 估计 
D. 如 果 抽 样 分 布 的 均值 不 等 于 总 体 参数 ， 则 该 统计 量 称 作 参 数 的 无 偏 估计 
9. 对 同一 个 总 体 的 两 个 无 偏 估计 量 外 和 人 ， 若 称 久 是 比 0; 更 有 效 的 一 个 估计 量 ， 则 Â 和 需要 满 
足 的 条 件 是 ( 。 )。 
A. D(0)> D(0:) B. DÊ) < D(0:) 
C. COV(0) > COV(0;) D. COV(O) < COV(0:) > 
10. 从 服从 正 态 总 体 的 总 体 中 抽取 容量 为 8、24、64 的 样本 ， RN 样本 均值 的 标准 
差 ( =) 





A. 增加 B. 减少 @ wa D. 服从 x 分 布 
11. 总 体 均值 为 20， 标 准 差 为 6， 从 此 总 体 中 随机 : 5 36 的 样本 ， 则 样本 均值 和 抽样 分 布 的 
标准 误差 分 别 为 ( )- 
A.20,6 B. 20, 1 AS F D. 6,6 
12. 某 大 学 附近 的 一 家 超市 记录 了 过 了 i 销售 额 ， 其 每 天 销售 额 的 均值 为 2 000 元 ， 标 准 差 
为 500 元 。 由 于 在 某 些 节日 的 销售 额 偏 高 ， 每 日 销售 额 的 分 布 时 右 偏 的 。 假 设 从 这 两 年 中 随机 抽取 
100 天 ， 并 计算 这 100 天 的 平均 销售 额 ， 
A. 正 态 分 布 ， 均 值 为 200 元 标准 差 为 50 元 A 
B. E8, 1482920000, mAs GAL 
C. 右 偏 ， 均 值 为 &000 元 ， 标 准 差 为 500 元 NA 
D. 正 态 分 布 ， 均 值 为 2000， 标 准 差 为 
13. 从 值 为 2500， 标准 差 为 500 ii 取 容 量 为 100 的 简单 随机 样本 ， 用 样本 均值 估计 总 体 
均值 。 样 A Je 
B. 2 500 C. 2 000 D. 1 500 
14. 和 标准 差 为 500 的 总 体 中 抽取 容量 为 100 的 简单 随机 样本 ， 用 样本 均值 估计 总 体 
均值 。 样 本 均值 的 标准 差 是 (  ). 











A. 100 B. 150 C. 50 D. 500 

15. 假定 总 体 比例 为 0. 8， 从 此 总 体 中 抽取 容量 为 100 的 样本 ， 则 样本 比例 的 数学 期 望 为 (  ). 
A.0.8 B. 0.4 C. 0.04 D. 0.001 6 

16. 假定 总 体 比例 为 0. 8， 从 此 总 体 中 抽取 容量 为 100 的 样本 ， 则 样本 比例 的 标准 差 为 (。 )。 
A.0.8 B. 0.4 C. 0.04 D. 0.001 6 

17. 估计 一 个 正 态 总 体 方差 时 ， 应 使 用 的 分 布 是 ( 。“) 分 布 。 
A. 标准 正 态 B.F C. 1 分 布 D. 好 

18. 当 总 体 的 方差 未 知 ， 且 为 大 样本 的 情况 ， 对 总 体 均值 进行 估计 ， 所 使 用 的 分 布 是 (  ) 分 布 。 
A. 标准 正 态 B.F Gh D. Z 

19. 当 总 体 的 方差 未 知 ， 且 为 小 样本 的 情况 ， 对 总 体 均值 进行 估计 ， 所 使 用 的 分 布 是 ( — ) 分 布 。 
A. 标准 正 态 B. F Et Dy 

20. 当 总 体 的 方差 已 知 ， 且 为 大 样本 的 情况 ， 对 总 体 均值 进行 估计 ， 所 使 用 的 分 布 是 ( 。 “) 分 布 。 
A. 标准 正 态 B. F Ci D. Z 


Cg 





21. 当 总 体 的 方差 已 知 ， 且 为 大 样本 的 情况 ， 对 总 体 均值 进行 估计 ， 所 使 用 的 分 布 是 ( 
A. 标准 正 态 B.F Gë D. 好 


22. 在 进行 参数 估计 时 ， 评 价 估计 量 的 标准 之 一 是 使 估计 量 抽样 分 布 的 数学 期 望 等 于 被 估计 的 总 体 参 


) 分 布 。 





23. 在 进行 参数 估计 时 ， 评 价 估计 量 的 标准 之 一 是 使 它 与 总 体 参数 的 离 差 越 小 越 好 ， 这 


数 ， 这 一 评价 标准 称 为 ( — )。 

A. 充分 性 B. 无 偏 性 
IO ). 

A. 充分 性 B. 无 偏 性 


C. 有 效 性 D. 一 致 性 


一 评价 标准 称 


C. 有 效 性 D. 一 致 性 


24. 根据 某 班 统计 学 成 绩 的 一 个 样本 ,估计 全 班 同学 统计 学 平均 成 绩 的 95% 的 置信 区 间 为 75 一 85 分 。 


则 全 班 同学 统计 学 的 平均 分 数 ( 。”)。 
A. 有 95% 的 概率 落 在 这 个 区 间 内 
C. 一 定 落 在 这 个 区 间 内 
当 置 信 水 平一 定时 ， 置 信 区 间 的 宽度 ( 
A. 同样 本 容量 的 大 小 无 关 
C. 随 样本 容量 的 增 大 而 减 小 
26. 当 样本 容量 一 定时 ， 置 信 区 间 的 宽度 ( 
A. 同 置信 水 平 的 大 小 无 关 
C. 随 置信 水 平 的 增 大 而 减 小 


2 




















27. 在 置信 水 平一 ks 


D. 可 能 在 这 一 区 间 内 不 在 这 一 区 间 内 
B. 同样 TON 
D. < 大 而 增 大 

信 水 平 的 平方 成 正比 


i 


量 小 的 样本 所 构造 的 置信 区 间 (。”)。 








B. 有 — EIP 


)。 





A. 可 能 宽 可 能 窗 B. 相同 _, 
C. ER D. 要 宽 X 

28. saj k s: pni EEEE )。 
A. Z,, oÍ In D. Z,o°/n 

29. 在 重复 抽样 或 无 限 总 伍 抽样 的 条 件 下 ， 总 体 方 多 大 样本 情况 下 ， 边 际 误差 为 ( — )。 
A. Z sn B. tn-D)s/Vn sy EDZ, fn D. 1,(n-D)s/Vn 

30. 7 FBOEKU AIR AWKI E F, ST ERRA, MERRE, AURREI — ). 
A. 2 Ys/Nn B. L, (n-1)s/ Jn C. Zn D. zz-Ds/ Jn 

三 、 计 算 题 


1. 从 均值 为 81， 标 准 差 为 12 的 总 体 中 , 抽取 一 个 容量 为 100 的 简单 随机 样本 ， 估 计 总 体 均值 & 的 置 


售 区 间 。 
(1) 三 的 数学 期 望 是 多 少 ? 
(2) 碟 的 标准 差 为 多 少 ? 





G) 在 95% 的 置信 水 平 下 ， 边 际 误差 是 多 少 ? 





(4) 求 总 体 均值 的 95% 的 置信 区 间 。 


2. 从 一 个 总 体 标准 差 为 4 的 总 体 中 抽取 一 个 样本 容量 为 36 的 样本 ,样本 的 均值 为 29， 则 样本 均值 的 


抽样 标准 差 为 多 少 ? 


3. 从 总 体 均值 为 10, 标 准 差 为 100 的 总 体 中 ,抽取 一 个 样本 容量 为 20 元 , 的 随机 样本 ,样本 均值 为 元 ， 


同样 ， 再 抽样 一 个 样本 容 


量 为 50 的 随机 样本 ， 样 本 均值 为 去。 ， 分 布 描述 元 , 和 去, 的 抽样 分 布 。 


4. 从 总 体 比例 x=0.5 的 总 体 中 ， 抽 取 一 个 样本 容量 为 100 的 随机 样本 。 


(D p 的 数学 期 望 是 多 少 ? 
(2) p 的 标准 差 为 多 少 ? 


NK) 
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(3) 在 90% 的 置信 水 平 下 ， 边 际 误差 是 多 少 ? 

(4) 求 总 体 比例 90% 的 置信 区 间 。 

5. 设 总 体 比例 为 0.8， 分 别 从 总 体 中 抽取 样本 容量 为 100、500、1 000 的 样本 。 

(1) 分 别 计算 每 个 样本 比例 的 标准 差 。 

D 随 着 样本 容量 的 增 大 ， 样 本 比例 的 标准 差 是 如 何 变化 的 ? 

6. 某 研究 机 构想 了 解 现在 每 个 家 庭 每 天 看 电视 的 平均 时 间 ， 随 机 抽取 了 200 个 家 庭 所 为 研究 对 象 ， 
测 得 每 个 家 庭 每 天 看 电视 的 平均 时 间 为 6.25h， 标 准 差 为 2.5h， 求 现在 每 个 家 庭 每 天 看 电视 平均 时 间 的 置 
信 区 间 。 置 信 水 平分 别 为 90%、95% 和 99%。 

7. 某 小 学 的 班主 任 想 了 解 班级 学 生 上 学 从 家 到 学 校 的 距离 ， 随 机 抽取 了 16 名 学 生 组 成 的 一 个 样本 ， 
得 到 他 们 从 家 到 学 校 的 距离 (km) 如 下 : 

10 20 15 9 12 15 21 H 16 18 12 16 13 > 

求 班 上 学 生 从 家 到 学 校 平均 距离 90 的 置信 区 间 。 

8. 某 品牌 的 灌 装 饮料 , 每 瓶 标准 容量 为 500mL， i bh 随机 抽取 50 瓶 进行 检查 ， 
测 得 每 瓶 的 容量 见 表 5-7 所 示 。 




















表 5-7 样本 数据 x< 
每 瓶 容量 /mL he XV 瓶 数 
496 一 498 7 H š 2; 
498—500 Y 3 
500~502 SAW șa ji 
502=504 1 7 
504~506 17 N 2 4 
合 讳 “= 50 


试 确定 该 品牌 次 料 平均 容量 os% A Ka A 
9. RNEER TS DLU, NEARER ETEA, MERHAR 

nami SS 其 中 赞成 该 项 措施 的 入 效 占 20%， 求 总 体 比例 的 90% 和 95% 的 置信 区 间 。 

10. 在 药品 制造 业 ， 药 品 的 重量 非常 关键 ， 对 某 种 特定 的 药物 进行 检查 ， 从 25 个 样本 中 得 到 样本 的 
标准 差 为 0.6g， 求 该 药物 重量 的 总 体 方差 95% 的 秆 信 区 间 。 

11. 拥有 工商 管理 学 士 学 位 的 大 学 毕业 生年 薪 的 标准 差 大 约 为 2 000 元 ， 假 定 想 要 估计 年 某 95% 的 轩 
信 区 间 ， 并 希望 边际 误差 为 400 元 ， 应 抽取 多 大 的 样本 容量 ? 

12. 根据 以 往 的 生产 经 验 ， 某 种 产品 的 合格 率 为 98%， 如 果 要 求 该 产品 合格 率 95% 的 置信 区 间 ， 且 要 
求 边际 误差 不 超过 5%， 应 抽取 多 大 的 样本 容量 ? 
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未) 


掌握 假设 检验 的 步骤 。 

了 解 假设 检验 的 基本 问题 。 

掌握 一 个 总 体 参 数 (均值 、 比 例 和 方差 ) 的 假设 检验 
掌握 两 个 总 体 均值 之 差 的 假设 检验 。 ] 
掌握 两 个 总 体 比例 之 差 的 假设 检验 :1 
掌握 两 个 总 体 方差 之 比 的 假设 检验 。 
掌握 假设 检验 的 软件 操作 过 程 ， 


Azo J 





1. 
2 
3. 
4. 
5: 
6. 
7. 





女子 体温 一 般 比 男子 约 高 0.3'C 
当 问 起 健康 的 艳 第 人 中 女子 体温 是 否 与 男子 笨 温 相同 时 ， 多 数 人 的 回答 是 不 相同 ， 但 不 知道 是 多 少 ， 
根据 有 关 数 据 显 若 ， 女 子 的 体温 比 男子 的 高 于 0.3 心 ， 那 么 这 个 结论 是 否 是 正确 的 呢 ? 表 6-1 是 一 个 研究 
人 员 测 量 的 50 个 健康 成 年 人 的 体温 ( C ) 数据 。 


表 6-1 50 个 健康 成 年 人 体温 测量 数据 表 























根据 样本 数据 计算 的 平均 值 为 : 男生 的 平均 值 为 36.7C， 标 准 差 为 0.361 4C; 女子 的 体温 平均 值 为 
36.9C， 标 准 差 为 0.349 0C。 从 样本 数据 可 得 出 女子 的 体温 平均 比 男子 的 体温 高 于 0.2C， 那 么 我 们 是 不 
是 就 可 以 得 出 女子 的 体温 比 男子 的 要 高 ,而 不 是 高 于 0.3C, 是 0.2C 呢 ? 本 章 的 内 容 将 提供 一 大 ,标准 统计 
程序 来 检验 这 个 问题 。 
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64 假设 检验 的 基本 理论 


6.1.1 假设 检验 的 定义 


在 现实 生活 中 ， 人 们 经 常 要 对 某 个 “假设 ”做 出 判断 ， 确 定 它 的 真 假 。 在 研究 领域 中 ， 
研究 者 在 检验 一 种 新 的 理论 时 ， 往 往 也 是 首先 提出 一 种 自己 认为 是 正确 的 看 法 ， 即 假设 。 
而 在 统计 学 中 ,“ 假 设 ”就 是 对 总 体 参数 的 一 种 事先 猜想 。 

定义 6.1 对 总 体 参 数 的 具体 数值 所 做 的 陈述 ， 称 为 假设 ， 也 称 统计 假设 。 

-个 假设 的 提出 总 是 以 一 定 的 理由 为 基础 的 ， 但 这 些 理由 通常 又 是 不 完全 的 ， 因 而 产 
生 了 “检验 ”的 需求 ， 也 就 是 要 进行 判断 。 例 如 ， 在 对 某 一 品牌 洗 农 ; 的 抽检 中 ， 抽 检 人 
员 需 要 判断 其 净 含 量 是 否 达到 了 说 明 书 中 所 声明 的 质量 ; 公司 浴 收 到 一 批 货物 时 ， 质 检 人 
员 需 要 判断 该 批 货物 的 属性 是 否 与 合同 中 规定 的 一 致 ; 某 众 业 使 用 自动 线 生 产 产品 ， 质 检 
人 员 检 验 自动 线 生产 是 否 正常 等 。 RA N) 

当 提 出 假设 后 ， 通 常 要 对 假设 进行 判断 。 ujkuna. 假设 检验 是 利用 样本 信息 判断 
假设 是 否 成 立 的 过 程 。 > MSN 

定义 6.2 SABEDES, WAHRER EAN BUET, 
称 为 假设 检验 。 CN 
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传统 假设 检验 的 基本 步骤 有 4 个 。 x- N 


(1) WIB H, 和 备 择 假设 万 .下 < £ 

(2) Si JAE / 

(3) 根据 给 出 的 显著 性 水 平 w ， 确 定 拒绝 原 假设 H, 的 区 域 。 

(4) 统计 决策 。 

下 面 一 一 来 介绍 每 一 步 的 内 容 。 

1) 提出 原 假设 已 和 备 择 假设 也 

首先 要 清楚 什么 是 原 假设 有 ,和 备 择 假设 H, 。 

定义 6.3 通常 将 研究 者 想 收 集 证 据 予 以 支持 的 假设 称 为 备 择 假 设 , 即 研究 人 员 认 为 正 
确 的 观点 ， 用 H 表示 。 

备 择 假设 通常 是 用 于 支持 自己 的 看 法 。 例 如 ， 质 检 部 门 要 检验 某 车 间 某 天 生产 的 产品 
是 否 合格 ， 就 应 该 把 他 们 认为 的 想法 作为 备 择 假设 ， 我 们 正在 做 一 项 研究 ， 并 想 使 用 假设 
检验 来 支持 我 们 的 说 法 ， 就 应 该 把 我 们 认为 正确 的 看 法 作为 备 择 假 设 。 

定义 6.4 通常 将 研究 人 员 想 收集 证 据 予 以 反对 的 假设 称 为 原 假设 , 即 研究 人 员 认 为 不 
正确 的 观点 ， 用 H, 表示 。 

在 假设 检验 中 ， 确 定 原 假设 和 备 择 假设 十 分 重要 ， 它 直接 关系 到 检验 的 结论 。 从 原 假 
设 和 备 择 假设 的 定义 来 看 ， 如 果 找 出 研究 人 员 ， 之 后 再 确定 研究 人 员 的 想法 ， 其 予以 支持 
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择 假 设 的 建立 过 程 。 



































此 观点 即 为 备 择 假设 ， 相 反 的 为 原 假设 。 
所 以 研究 者 建立 的 原 假 设 和 备 择 假设 应 为 









H,: 1=100(9 程 正常 ) 
H: 4w#100( 生 产 过 程 不 正常 ) 


mite i 


6 = 


的 观点 就 是 备 择 假设 ， 相 反 ， 就 是 他 反对 的 观点 ， 即 为 原 假设 。 下 面 举例 说 明 原 假 设 和 备 





【 例 6.1】 一 种 食品 生产 企业 以 生产 袋 装 食品 为 主 ， 按 规定 每 袋 的 标准 净 含量 要 求 为 
00g， 为 对 生产 过 程 进行 控制 ， 质 量 监测 人 员 定 期 对 袋 装 食品 进行 检查 ， 以 确定 生产 出 来 
为 食 品 是 否 符合 要 求 。 如 果 平 均 净 含 量 大 于 100g 或 小 于 100g， 都 表明 生产 过 程 不 正常 ， 
必须 进行 调整 。 试 陈述 用 来 检验 生产 过 程 是 否 正常 的 原 假设 和 备 择 假设 。 

解 : 如 果 企 业 生产 的 食品 净 含 量 y=100, 表明 生产 过 程 正 常 ; WR u> 1005 <100, 
表明 生产 过 程 不 正常 。 究 竟 哪 个 作为 原 假设 ， 哪 个 作为 备 择 假设 ， 需 要 先 找 出 研究 者 。 
据 题 意 可 知 ， 研究 者 为 质量 监 十 人员， 如 果 他 认为 产品 是 合格 的 话 ， 他 不 用 去 检查 ， 只 

他 认为 不 合格 , 才 会 去 检查 。 hs Ana a ¿i r tasa 



































[0] 6.2] 某 品 牌 奶粉 在 产品 说 明 书 中 声称 六 尘 均 净 含量 不 少 于 400g。 从 消费 者 的 利 


益 出 发 ， 有 关 研 究 人 员 要 通过 抽检 其 中 的 = 批 奶粉 关 “ 品 来 检验 该 产品 











实 。 试 陈述 用 于 检验 ;的 原 假设 与 备 择 假设 。 





制造 商 的 说 明 是 否 属 


解 : 该 品牌 奶粉 平均 净 含 量 OPORA 如 果 抽检 的 结果 发 现 几 < 400, 则 表明 该 产品 
说 明 书 中 关于 其 净 含 量 量 的 内 容 是 不 真实 的 ， 有 关 部 门 应 对 其 采取 相应 的 措施 。 


该 题 的 研究 人 员 是 从 消费 者 的 利益 出 发 对 产品 说 明 书记 的 质疑 ， 否 则 不 会 去 抽检 
产品 ， 所 以 研究 者 认为 的 观点 是 人 < 400 , ERRATAS. 相反 ， 就 是 原 假 设 的 内 








容 。 所 以 研究 者 的 原 翁 设 与 备 择 假设 应 为 
Hy: />300 


p 


Hu 4 400 x< 








【 例 63]- “ 某 家 企业 的 研究 机 构 估 计 ， 该 企业 产品 的 市 场 占有 比例 超过 20%。 为 验证 


这 一 估计 是 否 正确 ， 该 研究 机 构 随机 抽取 了 一 个 样本 进行 检验 。 


与 备 择 假 设 。 


用 于 检验 的 原 假设 


解 : 设 该 企业 产品 的 市 场 占 有 比例 真 值 为 z 。 显 然 ， 研 究 者 就 是 这 家 企业 的 研究 机 构 ， 
他 们 认为 的 观点 是 “产品 市 场 占有 比例 超过 20%”。 因此, 研究 者 建立 的 原 假设 和 备 择 假设 

















H,: z<20% 


H,: z>20% 





下 面 把 以 上 的 3 个 例子 汇总 到 表 6-2 格 中 , 来 总 结 一 下 原 假设 和 备 择 假设 的 一 些 特点 。 





表 6-2 3 个 例题 的 原 假设 和 备 择 假 设 











例题 原 假设 和 备 择 假设 
例 6.1 H,: #=100; H,: yu#100 

例 6.2 | H,: #2400; H,: #<400 

例 6.3 H,: z<20%; H,: x>20% 
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O) 原 候 设 和 备 择 俱 设 是 一 个 完备 事件 组 ， 而 且 相互 对 立 。 
从 上 面 的 3 个 例题 可 以 看 出 ， 原 假设 和 备 择 假设 的 集合 区 域 旦 一 个 完备 事件 组 ， 且 是 
相互 对 立 的 ， 也 就 是 说 ， 在 一 项 假设 检验 中 ， 原 假设 和 备 择 假设 必 有 一 个 成 立 ， 而 且 只 有 
一 个 成 立 。 
O 在 建立 假设 时 ， 通 党 先 确定 备 择 假设， 然后 再 确定 原 假设 。 

O 在 假设 检验 中 ,，“=” 总 是 放 在 原 假设 上 。 

从 上 面 的 3 个 例子 可 以 得 知 ,“=” 出 现在 原 候 设 上 ， 决 不 会 出 现在 备 择 候 设 

(假设 检验 的 目的 主要 是 收集 证 据 拒绝 原 假设 。 
研究 人 员 想 证 明 的 是 他 的 观点 ， 而 他 认为 正确 的 观点 作为 备 择 假设 ， 所 以 假设 检验 的 
目的 主要 是 收集 证 据 拒绝 原 假设 。 ” 

2) 构造 检验 的 统计 量 ， 并 计算 其 值 FN 
EIEND, WER ERETT ENTEROS E. 在 
实际 操作 中 ， 提 出 证 据 的 信息 主要 是 来 自 所 抽取 的 样本 假设 检验 就 是 要 任 借 可 获得 的 样 
本 观测 结果 帮助 研究 者 做 出 最 后 的 判断 和 决策 。 8, A ARAMEA, MRR 
提供 的 证 据 能 够 证 明 原 假设 是 不 真实 的 ， waste 理由 措 绝 它 ， 并 倾向 于 选择 备 择 
假设 。 既 然 研究 者 都 倾向 于 通过 样本 eh 设 提供 支持 ， 并 借 向 于 做 出 “拒绝 原 候 
A 1: 旺 信 息 进行 压缩 和 提炼， 即 检验 统计 量 便 
是 对 样本 信息 进行 压缩 和 概括 的 结 

定义 6.5 根据 样本 观测 结 nasie sena 和 备 择 假设 做 出 决策 的 某 个 
样本 统计 量 ， 称 为 检验 统计 量 。 

检验 统计 量 实际 ns x 就 是 总 体 均值 4 的 一 个 点 信 
计量 )， 但 点 估计 量 并 钉 能 直接 作为 检验 的 统计 基 : 只 省 将 其 标准 化 后 ， 才 能 用 于 度量 它 与 
原 假设 的 参数 从 之 enen. 

A es @ 点 估计 量 的 抽样 分 布 。 

通常 将 标准 化 检验 统计 量 简称 为 检验 颖 计 最 ， 即 检验 统计 量 是 服从 标准 正 态 分 布 、 如 
pt. hh Fat. 

例如 ， 对 于 总 体 均值 和 总 体 比例 的 检验 ， 标 准 化 检验 统计 量 可 表示 为 
atya LE _ 点 估计 量 一 假设 什 
E E 

检验 统计 量 是 一 个 随机 变量 ， 它 的 具体 数值 随 着 样本 观测 结果 的 不 同 而 不 同 ， 但 只 要 
已 知 一 组 特定 的 样本 观测 结果 ， 检 验 统计 量 的 值 也 就 唯一 确定 了 。 

检验 统计 量 要 求 不 能 含有 未 知 数 ， 若 含有 ， 则 无 法 计算 出 其 值 。 

3) 根据 给 出 的 显著 性 水 平 c ， 确 定 拒绝 原 假设 H, 的 区 域 

定义 66 “能够 拒绝 原 假设 的 检验 统计 量 的 所 有 可 能 取 值 的 集合 ， 称 为 拒绝 域 。 

拒绝 域 就 是 由 显著 性 水 平 a 所 围 成 的 区 域 。 如 果 利用 样本 观测 结果 计算 出 来 的 检验 统 
计量 的 具体 数值 落 在 了 拒绝 域内 ， 就 拒绝 原 假设 ， 否 则 就 不 拒绝 原 假设 。 

拒绝 域 的 大 小 与 事先 选 定 的 显著 性 水 平 有 一 定 的 关系 。 在 确定 了 显著 性 水 平 & 之 后 
就 可 以 根据 & 值 的 大 小 确定 出 拒绝 域 的 具体 边界 值 。 拒绝 域 的 边界 值 称 为 临界 值 。 在 如 何 
确定 临界 值 之 前 ， 先 介绍 一 下 什么 是 显著 性 水 平 w 。 
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(1) 显著 性 水 平 c 。 

假设 检验 的 目的 是 要 根据 样本 信息 做 出 决策 ， 也 就 是 做 出 是 否 拒绝 原 假设 而 倾向 于 备 
择 假设 的 决策 。 显 然 ， 研 究 者 希望 做 出 正确 的 决策 ， 但 由 于 决策 建立 在 样本 信息 的 基础 之 
上 ， 而 样本 又 是 随机 的 ， 因 而 研究 者 就 有 可 能 犯错 误 。 

如 前 所 述 ， 原 假设 与 备 择 假设 不 能 同时 成 立 ， 即 要 么 拒绝 原 假设 也 ， 要 么 不 拒绝 到 。 
此 时 ， 研 究 人 员 希 望 的 情况 是 ， 当 原 假设 及 , 正确 时 不 拒绝 它 ， 当 原 假设 H, 不 正确 时 拒绝 
它 。 但 是 ， 很 难保 证 不 犯错 误 。 假 设 检验 过 程 中 可 能 发 生 以 下 两 类 错误 。 

定义 6.7 当 原 假设 正确 时 拒绝 原 假设 ， 所 犯 的 错误 称 为 第 工 类 错误 ， 又 称 弃 真 错误 。 
犯 第 I 类 错误 的 概率 通常 记 为 a 。 

定义 68 ， 当 原 假设 错误 时 不 拒绝 原 假设 ,所 犯 的 错误 称 为 第 开关 错误 ,又 称 取信 错误 。 
犯 第 工 类 错误 的 概率 通常 记 为 。 KA 

假设 检验 中 的 结论 及 其 后 果 有 以 下 丙种 情况 ， 见 表 63KS 


表 6-3 “假设 检验 的 结论 与 后 困 | 



































未 拒绝 Ho 确 决策 >” BIRER A 
N 第 LERH a 正确 决策 
需要 注意 的 是 ， 当 样本 容量 定时 不 能 同时 减少 入， 即 可 以 不 犯 第 I 类 错误 或 
A 
关系 。 as 




















在 样本 容量 不 变 阅 情况 下 ， 要 减 小 就 会 使 AR, 而 要 增 大 a 就 会 使 1 减 小 ， 
类 错误 就 像 一 个 跷 跷 板 。 白 然 ， 人 们 希望 犯 两 类 糟 计 吴 的 概率 都 尽 可 能 小 ， rp 
到 。 要 使 @ 和 有 向 时 减 小 的 唯一 办 法 是 增加 祥 本 容量 ， 但 样本 容量 的 增加 又 会 受到 许多 因 
素 的 限制 , /所 以 人 们 只 能 在 这 两 类 错误 发 生 的 概率 之 间 进行 平衡 ， 以 使 与 8 控制 在 能 够 
接受 的 范围 内 。 
- 般 来 说 ,对 于 一 个 给 定 的 样本 , 如果 犯 第 I 类 错误 的 代价 比 犯 第 本 类 错误 的 代价 高 ， 
则 将 犯 第 I 类 错误 的 概率 定 得 低 些 较为 合理 ， 反 之 ， 如 果 犯 第 I 类 错误 的 代价 比 犯 第 [类 
错误 的 代价 低 ， 则 将 犯 第 I 类 错误 的 概率 定 得 高 些 。 
至 于 假设 检验 中 应 先 控制 哪 类 错误 ， 一 般 来 说 ， 发 生 哪 一 类 错误 的 后 果 更 为 严重 ， 就 
应 该 首先 控制 那 类 错误 发 生 的 概率 。 但 是 ,由 于 犯 第 工 类 错误 的 概率 可 由 研究 者 进行 控制 ， 
因此 在 假设 检验 中 ， 人 们 往往 先 控制 第 1 类 错误 的 发 生 概率 。 
RER 工 类 错误 的 概率 也 常用 于 检验 结论 的 可 靠 性 度量 ， 并 将 这 一 概率 称 为 显著 性 




































































水 平 。 
定义 6.9 假设 检验 中 发 生 第 I 类 错误 的 概率 ， 称 为 显著 性 水 平 ， 记 为 a 。 
常用 的 显著 性 水 平 有 a=0.01, a=0.05, a=0.1 等 ， 当 然 也 可 以 取 其 他 值 。 
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(2) 确定 临界 值 。 

O 检验 的 方向 。 

在 假设 检验 中 , 研究 者 感 兴趣 的 备 择 假设 的 内 容 , 可 以 是 原 假设 及 ,在 某 一 特定 方向 的 
变化 ， 也 可 以 是 一 种 没有 特定 方向 的 变化 。 例 如 ， 在 例 6.2 中 ， 研 究 者 感 兴趣 的 是 奶粉 的 
净 含 量 是 否 低 于 400g。 同 样 ， 在 例 6.3 中 ， 研 究 者 感 兴趣 的 产品 的 市 场 占有 比例 是 否 超过 
20%。 这 种 具有 方向 性 的 假设 称 为 单 侧 检验 (或 称 单 尾 检验 )。 相 反 ， 在 例 6.1 中 ， 研 究 者 感 
兴趣 的 备 择 假 设 没 有 特定 的 方向 ， 他 们 只 是 关心 备 择 假设 已 是否 不 同 于 原 假设 万 ,， 而 不 
关心 H 是 大 于 还 是 小 于  ， 这 种 没有 特定 方向 的 假设 称 为 双 侧 检验 (或 称 双 尾 检验 )。 

定义 6.10 备 择 假设 具有 特定 的 方向 性 ， 并 含有 符号 “之 ” 或 的 假设 检验 ， 称 














为 单 侧 检验 或 单 尾 检验 。 
定义 6.11 备 择 假 设 没有 特定 的 方向 性 ， 并 含有 符号 “Q Rise, 称 为 双 侧 检 
验 或 双 尾 检验 。 \ 


其 中 ,在 单 侧 检验 中 ， 由 于 研究 者 感 兴趣 的 方向 不 同 ， jy 分 为 左 侧 检验 和 右 侧 检验 。 
Pa Aranyt bein “< Vo > 验 ; 如 果 研 究 者 感 兴趣 的 备 择 假 
设 的 方向 为 “> ” 称 为 右 侧 检验 。 -5 
例如 ， 设 为 总 体 参数 (这 上 a mH 设 的 参数 的 具体 数值 ， 则 假设 检 
验 的 基本 形式 总 结 见 表 6-4 所 示 。 N 
A 假设 检验 的 基本 形式 























P — 

Pamu a 

J) 而 :pm SN f: Uh 
fà 


PEE 
ARRES 
~ 

@ 确定 临界 值 。 

定义 6.12 根据 给 定 的 显著 性 水 平 确定 的 拒绝 域 的 边界 值 ， 称 为 临界 值 。 

在 给 定 显著 性 水 平 a 和 检验 统计 量 的 分 布 后 ， 查 一 些 常用 统计 表 就 可 以 得 到 具体 的 临 
界 值 或 利用 Excel 中 的 统计 函数 也 可 以 得 出 此 临界 值 。 

如 果 双 侧 检 验 的 拒绝 域 在 抽样 分 布 的 两 侧 ( 所 以 称 为 双 侧 检验 )。 在 单 侧 检验 中 ， 如 果 
备 择 假设 具有 符号 “<”， 那么 拒绝 域 位 于 抽样 分 布 的 左 侧 ， 称 为 左 侧 检 验 ， 如 果 备 择 假设 
具有 符号 “> 之 ” 那么 拒绝 域 位 于 抽样 分 布 的 右 侧 ， 称 为 右 侧 检验 。 

在 给 定 显著 性 水 平 a 的 条 件 下 ， 拒 绝 域 和 临界 值 可 用 图 6.1 来 表示 。 

4) 统计 决策 
图 6.1 可 以 得 出 利用 统计 量 进行 检验 时 的 准则 。 
(1) 双 侧 检验 : | 统计 量 |> 临 界 值 ， 拒 绝 原 假设 。 
(2) 左 侧 检验 : 统计 量 的 值 <- 临 界 值 ， 拒 绝 原 假设 。 
G) 右 侧 检验 : 统计 量 的 值 之 临界 值 ， 拒 绝 原 假设 


注意 : 在 假设 检验 中 ， 应 对 原 假设 而 采取 “拒绝 ”或 “不 拒绝 ”的 表述 方式 ， 而 不 采 
取 “ 接 受 ” 的 表述 方式 。“ 不 拒绝 ”的 表述 实际 上 意味 着 并 未 给 出 明确 的 结论 ， 原 假设 正 
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确 与 否 尚未 确定 。 如 果 说 “接受 ” 原 假 设 ， 则 意味 着 已 经 证 明了 原 假设 是 正确 的 ; 但 实际 
上 ， 假 设 检 验 并 不 提供 原 假设 “正确 ”的 证 据 ， 它 只 提供 不 利于 原 假设 的 证 据 。 







拒绝 域 拒绝 域 








临界 值 Tm [Tr 
(0) 双 侧 检验 O 右 侧 检验 ， 
拒绝 域 QN 





— L. 
2 X% 
NS te 
nme 1 拒绝 域 和 临界 什 > 
` Pa 
2 利用 已 值 法 进行 决策 了 、 > 





1 利 P ETURA W 
(D 提出 原 假设 HW 和 备 择 假设 H, o X ein 
jeee A RH U 
(3) Í 统计 量 的 值 计 算 己 值 。 
(4) Bid 
ws aaa mukiessa 
和 第 四 步 的 内 容 。 

2) P 值 的 计算 

传统 的 统计 量 检验 方法 是 在 检验 之 前 确定 显著 性 水 平 a ， 这 就 意味 着 事先 确定 了 拒绝 
域 。 这 样 一 来 , 不 论 检验 统计 量 的 值 是 大 还 是 小 , 只 要 它 的 值 落 入 拒绝 域 就 拒绝 原 假设 太 ， 
否则 就 不 拒绝 原 假设 7, 。 这 种 固定 的 显著 性 水 平 a 对 检验 结果 的 可 靠 性 起 一 种 度量 作用 。 
但 不 足 的 是 ，a 是 犯 第 1 类 错误 的 上 限 控制 值 ， 它 只 能 提供 检验 结论 可 靠 性 的 一 个 大 致 范 
围 ， 但 对 于 一 个 特定 的 假设 检验 问题 ， 它 却 无 法 给 出 观测 数据 与 原 假设 之 间 不 一 致 程度 的 
精确 度量 。 也 就 是 说 ， 仅 从 显著 性 水 平 来 比较 ， 如 果 选 择 的 & 值 相同 ， 那 么 所 有 检验 结论 
的 可 靠 性 都 一 样 。 要 测量 出 样本 观测 数据 与 原 假设 中 所 假设 的 值 内 的 偏离 程度 ， 就 需要 计 
算 P 值 。 

定义 6.13 ”如 果 原 假设 ,是 正确 的 ， 那 么 所 有 的 样本 结果 出 现实 际 观测 结果 那么 极 
端的 概率 ， 称 为 P 值 ， 也 称 观察 到 的 显著 性 水 平 。 

下 面 来 看 尸 值 的 计算 过 程 。 
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HEH PERHERE, AEAF Z 表示 检验 统计 量 ，Z. 表示 根据 样本 数据 计算 
得 到 的 检验 统计 量 值 ， 对 于 假设 检验 的 3 种 基本 形式 ， 从 抽样 分 布 上 看 ， 计 算 尸 值 的 一 般 
表达 式 如 下 。 

(1) 左 侧 检验 。 
H: HŽ: H: U< 
当 j=p，P 值 的 计算 公式 为 
P=P(Z < Z.|u=u,) (6.1) 
(2) 右 侧 检验 。 
H: Sm: Hi: H> 
=a, PEHARA f 
P= P(Z >Z, |u=m) ps K (6.2) 
(3) 双 侧 检 验 。 KN 
Hy: HA Hi: H AD 
当 w= 兴 时 ， 尸 值 的 计算 公式 为 : LAN 
P=2P(Z 2 |Z. SF (6.3) 


为 了 理解 不 同 检验 的 P 值 计算 ， 可 以 用 图 52 来 表示 。 











(b) 右 侧 检验 





P 





Z, 
(c) 左 侧 检验 
图 6.2 TERRA P 

尸 值 的 计算 在 计算 机 软件 计算 十 分 容易 。 

3) 利用 书 值 决策 的 规则 

利用 尸 值 进行 决策 的 规则 十 分 简单 。 不 论 是 单 侧 检验 还 是 双 侧 检验 ， 使 用 尸 值 进 行 决 
策 的 准则 都 是 : 如 果 已 < xc , EH: 如 果 P >a， 不 拒绝 万 ,。 但 在 现代 统计 检验 中 
如 果 P <0.1 代 表 有 “一 些 证 据 ” 不 利于 原 假设 ,如果 PP 二 0.05 代 表 有 “适度 证 据 ” 不 利于 
原 假 设 ， 如果 已 < 0.01 代表 有 “很 强 证 据 ” 不 利于 原 假设 。 不 再 严格 的 给 出 显著 性 水 平 与 
尸 值 进行 比较 。 
EE 














meen iF 


本 节 将 在 6.1 节 的 基础 上 介绍 假设 检验 的 具体 应 用 ， 对 于 一 个 总 体 参数 的 假设 检验 包 
括 总 体 均值 上 、 总 体 比例 x 和 总 体 方差 or 。 
6.1 节 介 绍 的 所 有 概念 都 适用 于 下 面 介绍 的 检验 方法 , 对 于 检验 的 步骤 中 , 只 有 第 2 步 ， 
于 检验 的 参数 不 同 ， 因 此 计算 检验 统计 量 的 方法 有 所 不 同 。 本 节 的 所 有 例题 都 采用 了 两 
种 方法 进行 统计 决策 。 
6.2.1 一 个 总 体 均值 的 假设 检验 
一 个 总 体 均值 的 假设 检验 要 区 分 总 体 是 否 服从 正 态 分 布 、 愉 ghra 否 已 知 等 几 种 




































































情况 。 
l. 正 态 总 体 、 方 差 已 知 ， 或 非 正 态 总 体 、 大 样本 
当 总 体 服从 正 态 分 布 且 c 已 知 ， PAAR tt 样本 均值 的 
抽样 分 布 均 为 正 态 分 布 ， ph HAN 7 , Bx — N(u,— 1o), 所 


以 采用 正 态 分 布 的 检验 统计 量 amiei ftim» moam, 样本 均值 经 过 标准 化 后 
服从 标准 正 态 分 布 ， BAJADA Suh, ESEI: 
~) x= 
E74 S Z= ~ noy RP (6.4) 

RERE rh AAN -Z, dO): 如 果 是 左 侧 单 侧 检验 ， 则 拒绝 
域 为 (-oo,-Z.) 交 如 果 是 右 侧 单 侧 检验 ， 则 拒绝 天 (Z。,+) 。 其 中 临界 值 可 以 查 相应 的 统 
计 分 布 表 或 利用 Excel 的 统计 函数 计算 出 来 <~ 

[J 6 站 入 - 洪 种 袋 装 食品 采用 自动 生产 线 生 产 ， 每 袋 的 重量 是 255g， 标 准 差 为 5g。 为 
检验 每 袋 重重 是 否 符合 要 求 ， 质 检 人 员 在 革 天 生产 的 食品 中 随机 抽取 40 袋 进行 检验 ， 测 得 
每 袋 平均 重量 为 255.8g。 取 显著 性 水 平 为 a=0.05, 检验 该 天 生产 的 食品 是 否 符合 标准 要 求 。 

Wi: 

第 一 种 方法 ， 传 统 的 假设 检验 ， 步 又 如 下 。 

(1) 提出 的 原 假设 和 备 择 假设 为 

Hy: g=255; Hi; M255 

(2) 构造 检验 统计 量 ， 并 计算 其 值 。 

z=X— h _ 255.8—255 

al 5/J40 

G) 根据 给 定 的 显著 性 水 平 a=0.05 ， 查 标准 正 态 分 布 表 可 知 : 

Zan = Zoos =1.96 

所 以 拒绝 域 为 (Co,-1.96)U (1.96,4w) ， 或 者 临界 值 利用 Excel 计算 ， 操 作 的 过 程 如 下 。 

第 一 步 : 进入 Excel 表格 界面 ， 单 击 “ 插 入 函数 ”按钮 ， 弹 出 “插入 函数 ”对 话 框 ， 
在 对 话 框 中 单 击 “ 或 选择 类 别 ” 的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 中 选择 “统计 ”选项 ， 并 
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=1.01 
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在 “选择 函 参数 ”列表 中 选择 NORML.S.INV 选项 ， 单 击 “ 确 定 ” 按 钮 ， 弹 出 “函数 参数 ” 
对 话 框 。 

第 二 步 : 在 “函数 参数 ”对 话 框 中 Probability 文本 框 中 输入 “0.975”， 得 到 函数 值 
“1.959963985”， 如 图 6.3 所 示 ， 保 留 两 位 小 数 取 1.96。 






























NORNSINY 
Probability O 975 E= o ss 


= 1. 959963985 
返回 标准 正 态 分 布 的 区 间 点 


Probability ” 正 恋 分 布 概率 ， 介 于 0 与 ! 之 间 , 合 0 与 1 


计算 结果 = 1. 959963985 
有 关 襄 函数 的 帮助 00) 


图 6.3 “函数 参数 " 对 话 杠 1 一 
(4) 统计 决策 。 ANA m 
由 于 -1.96 <1.01<1.96， 因 此 不 拒绝 原 假 设 。 


检验 结果 表明 : 样本 提供 的 证 : 

不 符合 标准 要 求 。 
第 二 种 方法 ; A P METRAR 
2 Excet 中 的 统计 函数 功 角 E 计 算 ， Juku pakin F, 

一 步 ， 进入 Excel KORTI, Miti Š “插入 函数 “按钮 ， 弹 出 “插入 函数 ”对 话 框 ， 
Mrke “或 选择 类 别 ” 的 下 拉 按钮 ， 在 弹 : 的 下 拉 列 表 中 选择 “统计 ”选项 ， 并 
在 “选择 函数 ” Jea NORM.S.DIST 小 六 单 击 “ 确 定 ” 按 钮 ， 弹 出 “函数 参数 ” 
IE SN 、 

BPN E A A E S 得 到 函数 值 “0.843752355”， 
如 图 6.4 所 示 。 


是 足以 推翻 原 假设 ， 因此 不 能 证 明 该 天 生产 的 食品 








X SW 



























zio 


返回 标准 正 态 分 布 函 数值 。 
Z ”用 于 计算 标准 正太 分 布 函数 的 区 间 点 


计算 结果 = 0. 843752355 
有 关 这 函数 的 帮助 0) 





图 6.4 “函数 参数 ”对 话 框 2 


函数 值 “0.843752355， 表 示 在 标准 正 态 分 布 条 件 下 值 为 1.01 左边 的 面积 
于 是 双 侧 检验 ， 因 此 有 已 =2x(1-0.843752355)= 0.312 495 。 
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统计 决策 ， 已 = 0.312 495 > w = 0.05 ， 所 以 不 拒绝 原 假 设 ， 和 上 一 种 方法 的 结论 相同 。 

2. 正 态 总 体 、 方 差 未 知 ， 或 非 正 态 总 体 ， 但 样本 是 大 样本 

如 果 总 体 服从 正 态 分 布 且 o 未 知 ， 或 总 体 并 不 服从 正 态 分 布 ， 但 只 要 是 在 大 样本 条 件 
下 ， 样 本 均值 x 同 样 服从 正 态 分 布 ， 即 工 一 Nda) 。 设 假设 的 总 体 均值 由， 可 以 证 明 ， 


样本 均值 经 过 标准 化 后 服从 标准 正 态 分 布 ， 经 过 标准 化 以 后 的 随机 变量 还 是 服从 标准 正 态 
分 布 ， 即 








g= Ho ~ N(0,1) 





on à 
但 此 时 的 标准 正 态 分 布 的 统计 量 中 包含 了 一 人 此 时 的 统计 量 无 法 
作为 检验 的 统计 量 ， 但 由 于 样本 是 大 样本 ， 前 面 学 习 过 一 致 性 容量 的 不 断 增加 ， 
样本 所 计算 出 的 样本 统计 量 非常 接近 于 总 体 参数 ， 所 以 方差 s* 代 蔡 总 体 方差 
0 ， 即 当 总 体 方差 未 知 ， 但 为 大 样本 时 ， RA Ao 
(6.5) 
如 果 是 双 侧 检验 ， i 2) ,+a)， 如 果 是 左 侧 单 侧 检验 ， 则 拒绝 
域 为 (00,-2,); mt A BL (Z, +=) 。 
【 例 6.5】 一 种 机 床 加 工 的 零件 尺寸 绝 对 平均 误差 为 1; 生产 厂家 采用 一 种 新 的 


机 床 进行 加 工 以 期 竺 进一步 减低 误差 。 ee O 2 平均 误 关 旧 机 床 相 比 是 


否 显著 降低 ， 从 某 天 生产 的 零件 中 随机 抽取 50 检验 Paa 5 
x=12152mm, sS 0.365 749mm , WH Ne o a 


机 床 相 比 是 否 显著 降低 (a = 0.05) 


解 : 《<A Ky 

aA es 

(1) 提 人 省 原 假设 和 备 择 假设 。 

Hy: #2135; H,: #<135 

O 构造 检验 统计 量 ， 并 计算 其 值 。 
X-ko 

Z h 

其 中 根据 样本 数据 计算 得 








x=1.2152, s=0.365749 
计算 检验 统计 量 的 具体 数值 为 
mE x- m _ 12152-135 
s/n 0.365749] J50 
(3) 根据 给 定 的 显著 性 水 平 w=0.01 ， 查 标准 正 态 分 布 表 或 利用 Excel 的 统计 函数 (与 
例 6.4 操作 相同 ) 可 知 : 





=—2.6061 


Z, = Zo =2.33 
所 以 拒绝 域 为 (-o,-2.33) 。 


Ww 


统计 学 ( ) 理论 5 实务 — í í í í 


(4) 统计 决策 。 
Z=-2.6061< -Zu =-2.33 
所 以 拒绝 原 假设 。 该 检验 结构 表明 ， 新 机 床 加 工 的 零件 尺寸 的 平均 误差 与 旧 机 床 相 比 
有 显著 降低 。 
第 二 种 方法 : 利用 尸 值 进 行 决策 (操作 过 程 同 例 6.4)。 
计算 出 P=0.004 578 986 ,所 以 统计 决策 已 =0.004578 986<w = 0.01 ,所 以 拒绝 原 假设 。 
该 结论 与 统计 量 检 验 一 致 。 
【 例 6.6] 某 玉米 品种 的 平均 产量 为 5 100kg/hm2。 一 家 研究 机 构 对 玉米 品种 进行 了 改 
良 后 以 期 待 提高 产量 。 为 检验 改良 后 的 玉米 产量 是 否 有 显著 提高 ， 随 机 抽取 了 49 个 地 块 进 
行 试 种 ， 得 到 的 样本 平均 产量 为 5 275kg/hm2， 标 准 差 为 oken 试 检验 改良 后 的 玉米 
产量 是 否 有 显著 提高 。(w=0.05) KA 
解 : 
第 一 种 方法 .传统 的 假设 检验 ， 步 又 如 下 。 
) 提出 原 假设 和 备 择 假设 。 oh 
H,: u<5100; Ho 5100 
(2) 构造 检验 统计 量 ， 并 计算 其 值 。 ~ N 
zX 5275-5100 
s| Ja Ta0/Ja9 
G) 根据 给 定 的 显著 性 水 平 w>0.05 ， 查 标准 正 态 分 布 表 或 利用 Excel 的 统计 函数 计算 
(与 例 6.4 操作 相同 ) 可 知 : 了 了 Vx] 





























, Ç 





=8.75 








所 以 拒绝 域 为 (645:-Heo) 。 

(4) 统计 决策 >_ N 

HFRZAF8.75> Zoos =1.645 , tiza s pin. 检验 结果 表明 ， 改 良 后 的 玉米 产量 有 
显著 提 NRA 利用 Excel 计算 出 来 的 P 值 为 0.000088< wx=0.05， 同 样 拒绝 原 假 设 。 

大 样本 情况 下 一 个 总 体 均值 的 检验 方法 汇总 见 表 6-5 所 示 。 


表 6-5 大 样本 情况 下 一 个 总 体 均值 的 检验 方法 





















假设 形式 a 
' 
检验 统计 量 o 已 知 时 : Z= Ee o 未 知 时 : Z= 
a 与 拒绝 域 | C-Z,)UG,,+e) | (0,-2.) | (Z+ 





P ARRE P <a ， 拒 绝 原 假设 

3. 正 态 总 体 、 方 差 未 知 ， 样 本 是 小 样本 

在 小 样本 (n= 30 ) 情 形 下 ， 检 验 统计 量 的 选择 与 总 体 是 否 服从 正 态 分 布 、 总 体 方差 是 
己 知 有 着 密切 联系 。 


a 116 WY 





pamm mts 


= 


段 设 的 总 体 均 值 为 m ， 总 体 服从 正 态 分 布 ， 无 论 大 小 样本 ， 可 以 证 明 ， 样 本 均值 经 
过 标准 化 后 服从 标准 正 态 分 布 ， 经 过 标准 化 以 后 的 随 习 变量 还 是 服从 标准 正 态 分 布 ， 即 
一 如 
z=% ~N(0,1 
alia (0,1) 











此 时 该 统计 量 中 包含 了 一 个 未 知 参数 (ac )， 所 以 无 法 作为 w 的 检验 统计 量 。 又 因为 是 
小 样本 ,不 能 直接 用 样本 方差 洒 代替 o ， 此 时 从 标准 正 态 无 法 得 出 作为 总 体 w 的 检验 统计 
量 。 若 用 妨 分 布 ， 好 是 标准 正 态 分 布 的 平方 加 了， 经 过 平方 加 和 后 ， 其 式 中 还 有 一 个 未 
知 参数 (ac )， 还 是 不 可 以 。 此 时 可 用 +t 分 布 。 推 导 过 程 如 下 : 

(n—1)s° 









































一 2O-D 
所 以 有 f 
~tin- AN 


2 
¿e 
Vx /(n-l) 


把 上 两 式 代入 得 到 





整理 后 得 到 当 总 体 方差 RA QPR, 此 时 总 体 均 值 检验 的 统计 量 为 
VY = ny Wx (6.6) 


Ti 
如 果 是 双 侧 检验 ， , MI 635829 (0, -t, a(n- WU- ]),+%) ; 如 果 是 左 侧 单 侧 检 验 ， 


则 拒绝 域 为 (<05%h(n 一 1)) ; ME hpa > 则 拒绝 域 为 (Un_Diie) 。 其 中 临界 值 


可 以 查 1 分布 表 或 利用 Excel 中 的 统计 函数 计算 。 
小 样本 情况 下 一 个 总 体 均值 的 检验 方法 汇总 见 表 6-6 所 示 。 








表 6-6 小 样本 情况 下 一 个 总 体 均值 的 检验 方法 














PEN Hy: M=: Hy: #2 M: H: Sm: 
假设 形式 oi k E est Hu Su 
= [X-i 
检验 统计 量 o 已 知 时 : i o 未 知 时 : = 
a 与 拒绝 域 (2, -ta (nD Ul sn-l),+%m) | (t(n) | G(-D+@) 
尸 值 决策 准则 Pa ， 拒 绝 原 假设 


【 例 6.7】 一 种 机 床 加 工 的 零件 尺寸 平均 长 度 要 求 为 12cm， 高 于 或 低 于 该 标准 均 被 认 
为 是 不 合格 的 。 购 买 该 零件 的 企业 在 购 进 零件 时 ， 通 常 是 经 过 招标 ， 然 后 对 中 标的 零件 提 
供 商 的 样品 进行 检验 ， 以 决定 是 否 采购 。 某 汽车 生产 企业 对 一 个 零件 提供 商 提供 的 12 个 样 
本 进行 了 检验 ， 其 结果 见 表 6-7 所 示 。 




















NA 小 


表 6-7 某 汽车 生产 企业 的 样本 零件 的 长 度数 据 


| os | 2o | ns | uo | v4 | ns | 122 | 20 | i23 | no | 








假定 该 供 货 商 的 零件 长 度 服从 正 态 分 布 ， 那 么 在 <=0.05 的 显著 性 水 平 下 ， 检 验 该 供 货 
商 提供 的 零件 是 否 符合 要 求 。 

解 : 

第 一 种 方法 : 传统 的 假设 检验 ， 步 骤 如 下 。 

(1) 提出 原 假 设 和 备 择 假设 

H,: #=12; H,: i 

(2) 构造 检验 统计 量 ， 并 计算 其 值 。 











_X-/b 
s/ n 

其 中 根据 样本 数据 计算 得 : 天 =11.9，s =0.469 687 ， yka minuts 
= X _ 119-12 


= X02275 





Sn = 0.469 687/412 
(3) 显著 性 水 平 w = 0.05 ， 根 据 自由 度 n1= IA 1=11 ， 查 ! 分 布 表 可 知 ， 
tn—D = ts =2.593 
所 以 拒绝 原 假 设 的 ha o a 或 者 利用 Excel 的 统计 函数 计算 
可 得 ， 操 作 过 程 如 下 。 z 
第 一 步 ， 进入 Excel KRD Xut GEARI J 弹出 “插入 函数 ”对 话 框 ， 
在 对 话 框 中 单 击 “或 选择 类 别 ” 的 下 拉 按 钮 ， 在 弹出 的 下 拉 列 表 中 选择 “统计 ”选项 ， 
并 在 “选择 函 参数 ”列表 中 选择 TINV 选项 ， 单 击 “确定 ”按钮 ， 弹 出 “函数 参数 ”对 
话 框 。 5 = N 
第 二 步 :在 “ 国 数 参数 ”对 话 框 中 的 Probability 文本 框 中 输入 “0.025”, 在 Deg_freedom 
文本 框 中 输入 411”， 得 到 函数 值 “2.593092681”， 如 图 6.5 所 示 ， 保 留 3 位 小 数 取 2.593。 





TIW 
Probability [0.025 
Deg_freedom 11 


返回 疆 定 自由 度 和 双 尾 概率 的 学 生 -分布 的 区 则 点 


Deg freedn ”为 一 正 数 ， 用 于 定义 分 布 的 自由 度 


计算 结果 = 2 5983092681 


有 关 诸 函数 的 帮助 H) 





图 6.5 “函数 参数 ”对 话 框 3 


(4) 统计 决策 。 
于 |tF0.7375< mos(1D = 2.593 ， 因 此 不 拒绝 原 假设 ， 即 样本 提供 的 证 据 还 不 足以 
































(TY 


mimet iiS 
推翻 原 假设 。 
第 二 种 方法 ， 利 用 尸 值 进行 决策 ， 其 操作 过 程 如 下 。 
第 一 步 :进入 Excel 表格 界面， 单 击 “插入 函数 ”按钮 ， 弹 出 “插入 函数 ”对 话 杠 ， 
在 对 话 框 中 单 击 “ 或 选择 类 别 ” 的 下 拉 按钮 ， 在 弹出 的 下 拉 列 表 中 选择 “统计 ”选项 ， 并 


在 “选择 函数 ”列表 中 选择 TDIST 选项 ， 单 击 “确定 ”按钮 ， 弹 出 “函数 参数 ”对 话 
框 。 
































第 二 步 : 在 “函数 参数 ”对 话 框 中 的 X 文本 框 中 输入 “0.7375”， 在 Deg_freedom 文本 
框 中 输入 “11”， 在 “Tails” 文 本 框 中 输入 “2”， 可 得 出 统计 值 “0.476256199” 如 图 6.6 
所 示 。 























T P fü 0.476 256 199>0.05， 因 此 不 拒绝 原 假 设 。 j N 


= 0. 476256199 
返回 学 生 An z 
Tails ryf M MAM i AAN 


Ë a “函数 参数 ” a 
6.2.2 ya 


N HESPER F EN 所 以 总 体 比例 检验 的 3 种 基本 形式 如 下 。 
IM 








0) Hy: r=; H: Amo 
O 左 侧 检 验 ，H,: >m; Hi Z<. 
(3) AWE: H: x 二 zm; Hi: z2>Z° 
在 构造 检验 统计 量 时 ， 仍 然 利用 样本 比例 p 与 总 体 比 例 z 之 间 的 距离 等 于 多 少 个 标准 
Ho, 来 衡量 。 这 是 因为 ,在 大 样本 情形 下 ,统计 量 p 近似 服从 正 态 分布 ， 即 设 总 体 比例 x 
的 假设 值 z,， 检 验 的 统计 量 为 
__P-m __ 
N(0,1) (6.7) 


n 


大 样本 情况 下 总 体 比 例 检验 的 方法 见 表 6-8 所 示 。 


NS 


统计 学 ®© 理论 与 实务 ES 


表 6-8 大 样本 情况 下 总 体 比例 检验 的 方法 




















项 目 双 侧 检验 左 侧 检验 右 侧 检验 
ce Hy: =s H 2m Hy: AST: 
假设 形式 H: ZT, H: z<mx H: n>m 
z- 2 
检验 统计 量 Xo(l— Z) 
n 
a EAR | DUZ | Z) | (Z+) 





P 值 决策 准则 P<a， 拒 绝 原 假设 


【 例 6.8】 一 家 研究 机 构 ， 声 称 该 城市 拥有 汽车 比例 超过 46%, 为 验证 这 一 说 法 是 否 
属实 , 这 家 研究 机 构 部 门 抽取 了 由 200 个 家 庭 组 成 的 一 个 随机 样本 , 发现 有 87 个 家 庭 拥有 
汽车 。 取 显著 性 水 平 w=0.05 ， 检 验 该 城市 拥有 汽车 比例 是 否 超过 30%。 

解 : XY 

第 一 种 方法 : 传统 的 假设 检验 ， 步 骤 如 下 。 

(1) 提出 的 原 假设 和 备 择 假设 为 

H,: x<40%; H,: z> 40% K ` 

D 依据 题 意 ， 大 样本 ， MRR R 

` 2= pe 


ml- 5 
n 


根据 样本 结果 计算 得 Zn. .5% ， HEAD 


3 z= 0.435— 04. _ 0.035 _ 


VOP 0.4x(1-0.4) 0035 
N 200 


(3) 根据 显著 性 水 平 a=0.05 , 查 标准 正 态 分 布 表 或 利用 Excel 的 统计 函数 计算 (与 例 6.4 

操作 相同 ) 可 得 : 
Zan= Zoos 

所 以 拒绝 域 为 (-oo,-1.96)U(1.96,+oo) 。 

(4) 统计 决策 

由 于 |2|=1<2,=1.96， 因 此 不 拒绝 原 假设 。 在 显著 性 水 平 a=0.05 的 条 件 下 ， 样 本 提 
供 的 证 据 表明 该 机 构 的 说 法 并 不 属实 。 

第 二 种 方法 : 利用 尸 值 进行 统计 决策 ， 其 操作 过 程 同 例 6.4。 

计算 出 尸 值 为 0.1$56>w = 0.05 ， 不 拒绝 原 假 设 。 


623 ”一 个 总 体 方差 的 假设 检验 


对 于 多 数 生产 和 生活 领域 而 言 ， ee 
内 并 不 意味 着 整个 过 程 的 正常 ， 方 差 的 大 小 是 否 适 度 则 是 需要 考虑 的 另 一 个 重要 因素 。 一 
个 方差 大 的 产品 自然 意味 着 其 质量 或 性 能 不 稳定 。 因 此 ， 总 体 方差 oa 的 检验 是 假设 检验 
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的 重要 内 容 之 一 。 
ov 表示 假定 的 总 体 方差 的 某 一 个 取 值 ， 总 体 方差 检验 的 3 种 基本 形式 如 下 。 
(1) 双 侧 检验 。H,: o'=o l: HI: o? zo). 
(2) EMES. H: >o: Hi: <o. 
(3) 右 侧 检验 。H,: Po H,: P> 
对 总 体 方差 进行 检验 ， 检 验 统计 量 要 从 其 样本 方差 入 手 ， 设 总 体 方差 的 假设 值 为 cv ， 
前 面 的 介绍 可 知 其 检验 统计 量 为 





















































Ds 
o 


一 个 总 体 方差 检验 的 方法 见 表 6-9 所 示 。 YN 
表 6-9 一 个 总 体 方差 检验 的 方法 人、 


— y (6.8) 


(Z (n— 1),+eo) 





尸 值 决策 准则 


【 例 6.9】 一 个 制造 商 记 华 产 阐 零件 ELEI EAE O001 56mm. 后 来 为 削减 成 本 ， 
就 采用 了 -种 费用 较 低 的 生产 方法 。 从 新 方法 制造 的 过 件 中 随机 抽取 200 个 作 样 本 ， 测 得 
零件 直 径 的 广 关 类 0.007 limm2。 在 nang a= 0.05 下 ,检验 新 方法 生产 零件 的 方差 是 
否 比 老 方法 大 。< 

解 : Rinten 步骤 如 下 。 
(l) 提出 夭 假设 和 备 择 假设 。 
H,:o2 < 0.00156; Hi:o > 0.00156 
(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 
2_ (n-1)s? 








~ Z (n-1) 


其 中 s* =0.00211; cl =0.00156, WA 
2 _ (200-1)x 0.00211 
© 0.00156 

(3) a =0.05 ， 确 定 拒绝 原 假设 的 区 域 。 

根据 题 意 可 得 拒绝 原 假设 的 区 域 为 (x,*(199),+%) ， 其 中 查 x? 分 布 表 ， 
Zoos (199) = 232.9118 。 

(4) 统计 决策 。 
F ° =269.16 > xoos (199) = 232.9118 ,所 以 拒绝 原 假设 , 新 方法 比 老 方 法 的 方差 大 。 


=269.16 
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6.3 ”两 个 总 体 参数 的 假设 检验 


本 节 的 检验 主要 介绍 传统 的 假设 检验 的 程序 ， 一 般 不 再 给 出 拒绝 域 的 图 示 。 同 时 两 个 
总 体 参 数 的 假设 检验 的 Excel 操作 过 程 将 在 案例 中 进行 详细 的 介绍 。 
6.3.1 ”两 个 总 体 均值 之 差 的 假设 检验 
两 个 总 体 参数 的 检验 包括 两 个 总 体 均 值 之 差 jy 的 检验 、 两 个 总 体 比 例 之 差 z — z, 
的 检验 和 两 个 SAE s /oz 的 检验 等 。 检 验 的 程序 与 一 个 总 体 参 数 的 检验 类 似 ， 但 
统计 量 的 计算 要 复杂 一 YAN 


根据 样 本 获得 方式 的 不 同 ， 两 个 总 体 均值 的 检验 分 为 独立 样本 各 配对 样本 西 种 情形 ， 
而 且 也 有 大 样本 与 小 样本 之 分 。 检 验 的 统计 量 是 以 两 个 样本 均 入 之 差 亏 x, — x, HAED 


基础 构造 出 来 的 。 对 于 大 样本 和 小 样本 两 种 情形 ， Aa 全 玉生 人 化 用 人 
不 同 ， 检 验 的 统计 量 也 略 有 差异 。 


1. 独立 样本 ， 两 个 总 体 正 态 分 布 ， 3655. 大 样本 ， 且 两 个 总 体 方差 已 知 
当 两 个 总 体 是 正 态 分 布 ， 或 非 正 态 pen 但 大 样本 时， 从 两 个 总 体 各 自 抽取 的 样本 均 
值 均 服从 正 态 分布 ， 即 ~~ NU ID ~ N(a, Tah Mitu- 4 的 检验 统计 量 要 


vD N 
从 样本 抽样 分 布 古 一 二 “Z; 














所 以 有 


Rl — N(u, — -n Lo) 


z 


NIESE u O E. 可 检验 统计 量 为 
(x, - x) (4i — kth) 








V > Z= 
NAO 

N N 

`N 





~ N(0,1) (6.9) 





【 例 6.10】 某 企业 公司 对 男女 职员 的 每 天 平均 工资 进行 了 调查 ， 男 职员 总 体 的 方差 为 
四 = 64 ， 女 职员 总 体 的 方差 为 o3 = 42.25 。 独 立 抽取 了 具有 同类 工作 经 验 的 男女 ， 职 员 的 
两 个 随机 样本 ， 并 记录 下 两 个 样本 的 均值 、 样 本 容量 数据 见 表 6-10 所 示 。 在 显著 性 水 平 为 
0.05 的 条 件 下 ， 能 否认 为 男 职员 与 女 职员 的 每 天 平均 工资 存在 显著 性 差异 ? 


表 6-10 两 样本 的 数据 结果 














女 职员 
n, =32 
S = 70 
解 : 设 久 = 男 职员 的 平均 小 时 工资 ，j = 女 职员 的 平均 小 时 工资 。 
(1) 提出 原 假设 和 备 择 假设 。 

H,: 4-4, =0; H, : 4-4, #0 














mus, 1 8.6 8 














D 构造 检验 的 统计 量 ， 并 计算 其 值 。 
于 两 个 样本 是 独立 ， 目 方差 已 知 ， 所 以 检验 的 统计 量 为 
z-a- 


























~ N(0,1) 
1a +—o; 
n, n, 
-05-70-0 _ 3.002 
“Í 642.1. 24225 
44 32 


(3) 根据 显著 性 水 平 0.05， 拒 绝 原 假设 的 区 域 为 
(-oo,-Zoos)U(Zuos,+oo) 
查 标准 正 态 分 布 表 得 Zuws =1.96 ， 所 以 拒绝 域 为 (—o,— -19900 09). 
(4) 统计 决策 。 
因为 有 Z=3.002 > Z, =1.96 ， 所 以 拒绝 原 假 š, tiy 队员 与 女 职员 的 每 天 平均 
工资 存在 显著 差异 。 《A\ 
2. 独立 样本 ， 大 样本 ， 且 两 个 总 体 方差 未 知 
在 大 样本 情况 下 ， 两 个 样本 均值 之 差 负 -二 的 抽样 分 布 近似 的 服从 正太 分布， 即 有 
= — Xy s a 4h ga sioi) 
设 两 个 总 体 均值 之 差 的 假设 从 为 0% — 一 如 )o， 经 标准 化 祝 吉 得 
-co 人 

















HFA ERA RUB o? 和 ay 站 往 两 个 样本 是 大 样本 ， 可 分 别 用 样本 方差 只 和 8: 
BHR RRNA 














GD- 


Z ~ N(0,1) (6.10) 


【 例 6.11】 某 研究 机 构 对 两 种 组 装 产品 的 方法 每 小 时 组 装 产品 数量 进行 了 调查 ， 独 立 
抽取 了 有 共有 同类 工作 经 验 工 人 的 两 个 随机 样本 ， 并 记录 下 两 组 工人 的 每 小 时 组 装 产品 的 平 
均 数 量 、 样 本 容量 和 样本 方差 数据 ， 见 表 6-11 所 示 。 在 显著 性 水 平 为 0.05 的 条 件 下 ， 能 否 
认为 两 种 组 装 方法 平均 小 时 组 装 数量 是 否 存在 显著 性 差异 ? 

表 6-11 两 样本 的 数据 














样本 1 样本 2 
m=44 n,=32 
x =75 x,=70 
s =4 41 = ty 





Nr > 
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解 : 传统 的 假设 检验 的 步骤 如 下 。 
(1) 提出 原 假设 和 备 择 假设 。 
H: 4 A, =0; H: H, #0 
(2) 检验 的 统计 量 ， 并 计算 其 值 。 
于 两 个 样本 是 独立 ， 且 方差 已 知 ， 所 以 检验 的 统计 量 为 
ZE) -hh 



































~ N(0,1) 
[s Ts 
= t= 
n n, 
5 e -70)-0 -go9852 Š 
RAT 
和 3 <° 


G) 根据 显著 性 水 平 0.05， 拒 绝 原 假设 的 区 域 为 


(—, -Zoos)U(Zouos， +e) a 
查 标准 正 态 分 布 表 得 Zuos =1.96 , < 6) U (1.96, +0%0) 。 
(4) 统计 决策 。 Š 
因为 有 Z =8.985 2> Zes = 1.96 , A 法 即 认为 两 种 组 装 产 品 的 方法 存在 


显著 差异 。 
3. 独立 小 样本 的 检验 ， 且 Pom 
US a 让 检验 时 有 两 种 








情况 。 X t 

1) 两 个 总 体 的 方 aans F X 

无 论 两 个 战 人 的 7 差 是 否 已 知 ， 只 要 两 个 总 体 是 正 态 分 布 ， 其 各 自 的 样本 均值 均 服 
从 正 态 分 (HDC NG): 5, Sere ) ， 则 样本 抽样 分 布 束 一 雹 也 服从 正 态 


分 布 ， 有 “ 








3-3 ~ NG -m (+D o’) 
n n, 
经 标准 化 后 ， 可 检验 的 统计 量 为 
Z= (x —x,)-(A — ,) 
ddo 
n, 


~ N(0,1) 








于 统计 量 中 含有 未 知 数 (o?)， 两 个 样本 是 小 样本 ， 不 可 分 别 用 样本 方差 蔡 代 。 
于 两 个 总 体 是 服从 正 态 分 布 ， 所 以 有 
(nm -Ds Ds 
































2 2 —1)s; 
— Zm —l) Ds yp (n, —1) 
o° 


X 具有 可 加 性 ， 即 有 


2 < 
z = Ds +( -Ds = U. z (n, +n, — 2) 


EW 


mwem iiS 








根据 上 两 个 统计 量 ， 可 构造 出 以 下 统计 量 : 


T +n =2) 


vč In +n, —2) 


(x, —x,)—(Z, — b) 


1. 15 
—+— |> 
n, n, 
t= = = — t(n +n, =—2) 
n —1)s, + (n, —1)s; 
£ )s (n, )s2 Cn +n, —2) 
o` 


经 整理 得 








设 两 个 总 体 均 值 之 差 的 假设 值 为 (4 — 人) 经 标准 化 后 ， 可 得 检验 统计 温 为 
== )- (4 — 4) ~ (nm LLY ¿ (6.11) 


1 1 1m -Ds +m -D ,> 
n n, (n, + n, — 2) x Ws 


2) 两 个 总 体 的 方差 未 知 但 不 相等 时 \ 

两 个 样本 均值 之 标准 化 后 不 再 服从 自由 六 为 + 一 2 的 1 分 布 , 而 是 近似 服从 自 
由 度 为 v 的 1 分 布 ， 这 时 检验 统计 量 为 kY 
GNE) a -hh 


t= 














t= ~t(v) (6.12) 





该 统计 量 [的 自由 度 为 站 Jaa SRJ 


(6.13) 














中 ， 自 由 度 一 般 为 整数 ， 需 要 上 式 进 行 四 舍 五 入 取 整 数 。 

【 例 6.12】 用 甲 、 乙 两 种 方法 同时 加 工 某 种 同类 型 的 零件 ， 已 知 两 种 方法 加 工 的 零件 
直径 分 别 服从 正 态 分 布 WU ,az) 和 N(w,a3) 。 为 比较 两 台 机 床 的 加 工 精度 有 无 显著 差异 ， 
分 别 独立 抽取 了 甲 种 方法 加 工 的 8 个 零件 和 乙 种 方法 加 工 的 7 个 零件 ， 通 过 测量 得 到 的 直 
径 数据 ( 表 6-12), E a=0.05 的 显著 性 水 平 下 ， 检 验 两 台 种 方法 加 工 的 零件 是 否 一 致 : 


2 2 2 2 
=oi Ol £0; ° 


























表 6-12 两 种 方法 加 工 零 件 的 数据 


方法 零件 直径 





甲 10.5 | 9.8 9.7 10.4 10.1 10.0 | 9.0 | 9.9 
EA 10.7 9.8 95 10.8 10.4 9.6 10.2 z= 








WVE 
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f: 第 一 种 情况 : or=ay o 
(1) 提出 原 假设 和 备 择 假设 。 
H,:4 -4 =0; H. t, 0 























D 构造 检验 的 统计 量 ， 并 计算 其 值 。 
£= G-a ~t(n+n,-2) 
1 P 1 | —1)s? +(n, —1)s? 
n n, (n, +n, —2) 
中 ， 根 据 样本 可 计算 出 二 =9.925, ¥, =10.143; s? =0.2164, s} = 0.2729 。 
代入 检验 的 统计 量 中 ， 有 





s= 9925-1043 __ 0 gs5 Ó 
J0//8+1/7)x 0.242 5 w e 
(3)e=0.05, ， 所 以 拒绝 原 假设 的 区 域 为 AS 
(—, aizan W 
其 中 临界 值 查 1 分布 表 ， 可 得 wos(13) MT 以 拒绝 域 为 (-%,-2.532 638) U 
(2.532 638,+oo) 。 
(4) 统计 决策 。 F. XA 
|t [= 0.855 < t, xs (13) = 2.532 638 A; 不 绝 原 假 设 。 
第 二 种 情况 o #0,*。 N 
O MARKERER 










(2) a a” 


VV 

















£ [° i) 

su s 

其 中 += <a n; i 
JE 

m) (m 

n-1 n-i 

pa 9925-10143 — _ 0218 L08483 
02164+ 1x02729 C 0066035714 


(02154,2272) 
z 1 =12.1841， 所 以 自由 度 为 12。 


L j 


m-l nn-l 8-1 J= 
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(3)c =0.05 ， 所 以 拒绝 原 假 设 的 区 域 为 
(—,—t, xs (12)) U (¿xs (12),+00) 
其 中 临界 值 查 上 分 布 表 可 得 mos(l2)=2.560033 ， 所 以 拒绝 域 为 (—o,—2.560 033) U 
(2.560 033,+oo) 。 
(4) 统计 决策 。 
|t = 0.8483 二 4ws(12)=2.560033， 所 以 不 拒绝 原 假设 。 


4. 配对 样本 的 检验 


配对 样本 的 检验 需要 假定 两 个 总 体 配对 差 值 构成 的 总 体 服从 正 态 分 布 ， 而 且 配 对 差 是 
差 值 总 体 中 随机 抽取 的 。 | 

O 对 于 大 样本 情形 ， 配 对 莽 什 经 标准 化 后 服从 标准 正 态 分 布 K 办 此 设 西 个 总 体 均值 
之 差 (4 一 久 ) 的 假设 值 为 (pp),， 其 检验 的 统计 量 为 << < 


NOAS 









































Z= Th Nd 5) ` (6.14) 

式 中 ，4 为 配对 差 值 的 平均 数 ，5, 为 配对 差 值 的 标准 差 。 

(2) 对 于 小 样本 情形 ， 配对 差 值 经 标准 化 后 服 闪 自由 度 为 4 1 的 1 分 布 。 因此 设 两 个 总 
i pp ` RO 











(6.15) 





en 
之 =0.05， 检 验 8 名 教师 对 两 种 看 法 





[816431 15 pae 
(0 一 10 分 )。 评分 的 数据 网 表 6-13 所 示 。 取 显著 性 水 平 
的 评分 是 下 区 N? 









评分 等 级 





| | | | |: |。 |: 
解 : W j= 教师 对 看 法 1 的 平均 评分 ，j, = 教师 对 看 法 2 的 平均 评分 。 
(1) 依 题 意 建立 的 原 假设 和 备 择 假设 为 
H,:- 0, =0; H: 4-440 
(2) 由 于 是 小 样本 ， 因 此 检验 的 统计 量 为 
I pa) nn 


S /Vn 
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样本 配对 差 值 见 表 6-14 所 示 。 
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表 6-14 样本 配对 差 值 


























序号 看 法 1 看 法 2 差 值 
1 5 6 aj 
2 4 6 2 
3 7 7 0 
4 3 4 al 
5 5 3 2 
6 8 9 a 
7? 5 7 = 
8 6 6 0 











根据 样本 可 计算 出 d = -0.625 ; S, =1.302 47 ， 代 入 检验 统计 量 中 
-_-0625-0 _ -0.625 》 1357 24 
1.302 47/V8 0.460493 


G) 根据 给 出 的 显著 性 水 平 a = 0.05 ， 则 拒绝 项 假设 的 区 域 为 
(—,—to as (7)) Uho (7), +0) + 
其 中 临界 值 查 £ 分 布 表 可 得 6àas0()= 2.841244, ， 所 以 拒绝 域 为 (—o,-2.841244) U 
(2.841244,+oo) 。 
(4) 统计 决策 。 
-2.841 244 < -1.357 24 <2.841244 ， 所 以 不 拒绝 原 假设 。 





632 两 个 总 体 比 网 之 差 的 假设 检验 
两 个 总 体 化 例 之 差 (7 一) 的 检验 思路 配 一 个 怒 体 比例 的 检验 类 似 , 要 求 西 个 样本 都 是 大 
Rg em a er ee ge 
m 2 


可 以 得 到 两 个 总 体 比 例 之 差 的 检验 的 统计 量 为 
(P-P) -m —x;) 


z= 








aUa) LU) ARAARA ATR, HAERA Am. S 


n, n, 


要 利用 两 个 样本 比例 如 和 已 来 估计 。 有 具体 可 分 为 两 种 情况 。 
1. 检验 两 个 总 体 比例 之 差 是 否 相等 


检验 两 个 总 体 比 例 之 差 是 否 相等 ， 即 原 假设 和 备 择 假设 的 内 容 有 3 种 。 
(I) H eg =m,=0; H.,:m —=,w0., 
2) Hm -z,<0; H :m —xs, > 0. 
8) He: =n, 20 H, m —m,=<05 


OE/ 

















mis, 1 8.6 8 


am, 0-2), zi TUT) 最 佳 的 估计 量 是 将 两 个 样本 合并 后 得 到 的 合并 比例 尸 蔡 


m 
uma, SPAREDE TINIENT: 
Ba RREA 1 中 具有 某 种 属性 的 个 体 数 ，x, 表示 样本 2 中 具有 某 种 属性 的 个 体 数 ， 





























则 合并 后 的 比例 为 
= (6.16) 
n+n, 
此 时 设 两 个 总 体 比 例 之 差 的 假设 值 为 (zi -zx,),， 检 验 的 统计 量 为 
z= PPI- m) ~ wo,1) (6.17) 


(+ + Ja- 月 | 
2. 检验 两 个 总 体 比例 之 差 等 于 某 个 常数 A 


检验 两 个 总 体 比例 之 差 等 于 某 个 常数 ， "R 役 设 的 内 容 有 3 种 。 
(1) B= HC。 

@) H,:m —zm,<c;í Hit n> Coa x Ñ 

(3) H,:m -NAc; Him- S< 


这 时 + A =) Tana. pe 此 时 


SI 1 检验 的 统计 量 为 区 
(6.18) 





为 自己 成 功 的 人 数 为 48 人 ; 而 在 对 95 个 男 经 理 的 调查 中 ， 认 为 自己 成 功 

m 39 人 。 在 ga=0.05 的 显著 性 水 平 下 ， 检 验 男女 经 理 认 为 自己 成 功 的 人 数 比 例 是 否 
有 显著 差异 。 

M: 设 z= 女 经 理 认 为 自己 成 功 的 比例 ; x,= 男 经 理 认 为 自己 成 功 的 比例 。 

(1) 提出 原 假设 和 备 择 假设 。 

H;:zm —z,=0; H,:z,— z, +0 
(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 
根据 题 意 ， 是 检验 两 个 总 体 比例 之 差 是 否 相等 的 ， 所 以 检验 的 统计 量 为 
Z= (P-P) -T-T 


pa-p(1+2] 

n n, 

其 中 ， 根 据 样本 的 数据 ， 有 p =48/200=0.24; p,=39/95=0.41; p= 
所 以 有 


Wis oq: ea 在 随机 抽取 的 200 个 企业 的 


48+39 
200+95 








=0.295 ， 


NS 
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Z= 0.24-0.41 #0 _ 017 -2.991639 


1 ) x 0.003229 0.056 825 


0.295x(1— 029+ 
200 95 


(3) w=0.05 ， 确 定 拒绝 原 假设 的 区 域 为 
(~%, 20) U (Za2+0) 
其 中 查 标准 正 态 分 布 表 得 ，Zuw。 =1.96 ， 所 以 拒绝 域 为 (0,-1.96)U (1.96,+%) 
(4) 统计 决策 。 
|2|=2.991639 > Z, =1.96 ， 所 以 拒绝 原 假设 ， 即 男 、 女 经 理 认为 自己 成 功 的 人 数 比 
例 有 显著 差异 。 
【 例 6.45] 承 上 例 ， 在 e= 0.05 的 显著 性 水 平 下 te 经 理 认为 自己 成 功 











的 人 数 比例 是 否 高 于 15%。 
解 : 设 友 = 女 经 理 认为 自己 成 功 的 比例 ， 到 = 男 经 
(1) 提出 原 假设 和 备 择 假设 。 
H,:z#,—z, <0.15; H: Q Xr 0.15 
(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 
根据 题 意 ， 检 验 人 Pea SN 所 以 检验 的 统计 量 为 
> ZT. 


e 


功 的 比例 。 






TY j = EN 
其 中 ， 根 据 样本 的 数据 有 珊 与 487200= 0.24 ; a RA ， 所 以 有 


- > Z 
(0.41—0.24) — 0.15 " %1 _ 002 __ 340093 
024) ， 0.41x(1-0.41) (0003458 0.058807 
9 X N. 











G) s P SETE AUSE EA — 
H 


(Z, +0) 
其 中 临界 值 查 标准 正 态 分 布 表 得 Zs =1.645 ， 所 以 拒绝 域 为 (1.645,+%) 


(4) 统计 决策 。 
Z=0.340093 二 Zoos =1.645， 所 以 不 拒绝 原 假设 ， 即 男 经 理 比 女 经 理 认 为 自己 成 功 的 

人 数 比例 高 于 15%。 
6.33 ”两 个 总 体 方差 之 比 的 假设 检验 
在 对 两 个 总 体 的 方差 进行 比较 时 ， 通 常 将 原 假设 与 备 择 假设 的 基本 形式 表示 成 两 个 总 
体 方差 比值 与 数值 1 之 间 的 比较 关系 。 
构造 两 个 总 体 的 方差 之 比 of / o; 的 检验 , 其 检验 统计 量 要 以 其 样本 方差 之 比 s 1s 为 基 
础 。 其 构造 的 过 程 如 下 
两 个 总 体 是 服从 正 态 分 布 ， 其 样本 方差 是 服从 分 布 ， 即 有 
人 一 DY ~zn- (n; = Ds 

i o; 


既然 有 两 个 妇 分 布 ， 那 么 可 以 构造 出 一 个 严 分 布 ， 有 
Wh 























一 和 0-D 





mrn iF 


= (n, -1) 
F=— 2 ~ Fn, -1n -1) 


DS 0, _1) 
a o 


整理 得 





~> F(n; =La =1) 














e ER ， 所 以 有 其 检验 的 统计 量 为 


2 /0 





z) ~Fm-ln-l) ,MN (6.19) 


2 Jo 





【 例 6.16】 生产 工序 中 的 方差 是 工序 质量 的 一 个 重要 测度 通常 较 大 的 方差 就 意味 着 
产品 质量 的 波动 程度 大 ， 需 要 通过 寻找 较 小 的 工序 方差 来 改进 工序 。 现 有 一 旧 机 器 和 一 新 
机 器 两 台 机 器 ， 两 台 机 器 生产 的 伏 装 食品 重量 数据 见 表 6-15 所 示 。 


表 6-15 两 台 机 器 生产 的 袋 间 食品 重量 数据 























解 : 传统 的 假设 检 验 步骤 如 下 。 
(1) 提出 原 假设 和 备 择 假设 。 


H 


0 一 2 
G; 


(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 
z- 引 对 ~ F(n, -l,m —1) 
o; ), 











xi 中 [到 | = ， 根 据 样本 的 数据 可 得 s? = 0.048808; s? = 0.005901 ， 则 有 
o; J, 


_ 0.005901 
_ 0.048808 

(3)a =0.05 ， 确 定 拒绝 原 假设 的 区 域 为 
(0,F_,,, (21,24)) U(F,,,(21,24),+oo) 


=0.1209 
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中 临界 值 查 F IMRI F os(21,24)=0.422382, F. (21.24) = 2.310919 ， 所 以 拒绝 
域 为 (0,0.422 382)U (2.310 919,+oo) + 

(4) 统计 决策 。 

T F=0.209<F,,,(21,24) = 0.422382 ， 所 以 拒绝 原 假设 ， 即 新 旧 机 器 生产 的 袋 装 
食品 重量 方差 存在 显著 性 差异 。 






































64 案例 分 析 : 啤酒 市 场 的 调查 与 分 析 及 Excel 上 机 应 用 一 一 
啤酒 印象 与 性 别 的 相关 性 分 析 


在 第 4 章 的 案例 中 ， 分 析 了 性 别 对 啤酒 综合 印象 的 影响 ， 即 傣 析 男女 两 组 的 啤酒 综合 
印象 分 数 数据 进行 描述 性 分 析 ， 得 出 的 结论 是 男性 对 啤酒 的 及 均 印 象 分 数 远 高 于 女性 ， 但 
当时 还 不 能 说 性 别 对 啤酒 综合 印象 分 数 有 影响 。 通 过 本 章 的 学 习 必 现在 可 以 利用 假设 检验 
进行 分 析 ， 分 析 性 别 是 否 对 啤酒 综合 印象 分 数 有 显著 性 的 影响 \ 

s fe A WTE PEE p| SEZER ER r EN 9 y Sri t 38 bb fn 
== 一 a 安装 的 操作 过 程 如 下 。 





TNE FSERARSAIREO 第 一 步 : EA Excel 界面 ， 右 击 “Office 按钮 ” 在 弹出 
DER MRAR = 自 定义 快速 访问 工具 栏 ” 选 项 ， 如 图 6.7 
- BR, INH “Excel 选项 ”对 话 框 。 
一 ANBO: (E “Excel 选 天 中 对 话 框 中 ， 选 择 左 侧 的 “加 
图 67 选择 " 自 定义 快速 访问 工具 ， 载 授 选项 ， 单 击 有 下 多“ 转 到 ”按钮 ， 如 图 68 所 示 ， 弹 
栏 选 页 Z h RE” EK 

BED: EIET AEE, ses > 选项 ， 单 击 “ 确 定 ”按钮 ， 等 

待 安装 数据 分 析 开 其 库 ， sss a° 
























































el SN > 下 和 和 至 Vicrosoft Offce 1A, 

x A 

i maa 

s. ze 2E 

ze s 

E Chinese Translation addin caoi 

Office Special Symbol Input Add-in A 

azao 

资源 
UE ca ERAN Office\Office12\W 分 析 T 目 订 — 
898: COM addin that translates between Tradition 提供 用 于 统计 和 工程 分 析 的 数据 分 析 工 具 

图 6.8 “Excel 选项 ”对 话 框 图 6.9 “加 载 宏 ”对 话 框 


Wh 


migas 868 

安装 数据 分 析 后 ， 分 析 性 别 是 否 对 啤酒 综合 印象 分 数 有 显著 性 的 影响 ， 即 分 析 两 个 总 
体 的 均值 是 否 相 等 ， 也 就 是 分 析 两 个 总 体 均值 之 差 是 否 等 于 0。 
第 一 步 : 提出 原 假设 和 备 择 假设 
H; — B, =0; H,: — H, 0 
中 为 女性 总 体 的 啤酒 综合 印象 平均 分 数 ，j 为 男性 总 体 对 啤酒 综合 印象 平均 分 数 。 

第 二 步 : 构造 检验 的 统计 量 ， 并 计算 其 值 。 

前 面 已 经 介绍 过 ， 检 验 两 个 总 体 均值 之 差 是 否 等 于 0， 其 检验 的 统计 量 要 根据 具体 的 
情况 ， 用 不 同 的 检验 统计 量 。 具 体 分 为 两 大 情况 : 一 是 两 个 样本 相互 独立 ; 二 是 配对 样本 。 
经 分 析 ， 该 案例 中 的 两 个 样本 是 相互 独立 的 。 

在 两 个 样本 相互 独立 的 条 件 下 ， 又 分 为 两 种 情况 : 一 是 两 个 总 体 的 方差 已 知 ， 二 是 两 
TR ARMA “， 因 为 女性 样本 
中 有 11 人 ， 男 性 样本 中 有 19 人 。 

在 理论 中 ， 两 个 总 体 方差 未 知 ， 且 是 小 样本 时 ， sss: AA 
二 是 两 个 总 体 方差 不 等 。 rt, RRE 个 总 体 方差 是 否 相等 。 


1. 检验 两 个 总 体 方差 是 否 相等 i AA 
eY EERE 


n Ha to 


O sisi a, A 
en 










































































根据 前 面 的 介绍 a 
如 下 。 

第 一 步 : 打开 “ inaen Ahn, 单 击 “ 数 据 ” 一 “分 析 ” 一 
“数据 分 析 ” 按 钮 和 弹出 “数据 分 析 ” nae :分 析 工 具 ” 列 表 中 选择 “F- 检 验 双 
样本 方差 ”选项 ;7 如 图 6.10 所 示 。 x a 


x” 








图 6.10 “数据 分 析 ” 对 话 框 





第 二 步 : 单 击 “ 确 定 ” 按 钮 ， 弹 出 “F- 检 验 双 样本 方差 ”对 话 框 ， 在 “变量 1 的 区 域 ” 
文本 框 中 输入 “$A$38:$A$50” 在 “变量 2 的 区 域 ” 文 框 中 输入 “$B$38:$B$56”， 选 择 “ 标 
志 ” 复 选 框 ， 选 中 “输出 区 域 ” 单 选 按钮 ， 并 在 其 文本 框 中 输入 “$E$51”， 如 图 6.11 所 示 。 
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FEE 双 样本 方差 
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O Item 





图 6.11 “F- 检 验 双 样本 方差 ”对 话 框 
第 三 步 ， 单 击 “ 确 定 ”按钮 ， 得 到 如 图 6.12 所 示 的 统计 结 ERIO 
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3. 166666667 par - T66686867| 

9. 42424242 `: 264705882| 
18| 


sss 
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4 "i E 





k, 上 统计 结果 


根据 图 6.12， Su 1.504 339 166% < 

G) 根据 图 612， 可 知 检 骆 的 统计 量 值 PD181838 Je P (EA 0.217 551324， 而 这 里 
是 双 侧 检验 ， 应 在 单 尾 书 值 基础 上 乘 以 2。 NA 

(4) 统计 决策 。 “| 

P> 0.057 所 以 不 拒绝 原 假设 ， 即 两 条 她 信 的 方 着 相等 的 。 所 以 进行 两 个 总 体 的 均 
值 之 差 检验 时 EN “e Ó: WARISAN”. 

EPNER RARE R: PRENA”, IHE BR 
分 析 ” 对 话 框 的 “分 析 工 具 ” 列 表 中 选择 “t- 检 验 : 双 样本 等 方差 假设 ”选项 后 ， 单 击 “ 确 
定 ” 按 钮 ， 如 图 6.13 所 示 。 
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位 与 Sinar 
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图 6.13 ”选择 “t 检 验 : 双 样 本 等 方差 假设 ”选项 
在 “ft- 检 验 : 双 样本 等 方差 假设 ”对 话 框 的 “变量 1 的 区 域 ”文本 框 中 输入 “3$A$39: 
$A$50”， 在 “变量 2 的 区 域 ”文本 框 中 输入 “$A$39: $A$50”,“ 标 志 ” 复 选 框 ， 选 中 “ 输 
出 区 域 ” 单 选 按 钮 ， 并 在 其 文本 框 中 输入 一 个 空白 单元 格 ， 如 输入 “$E$63”， 如 图 6.14 
所 示 。 
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图 6.14 “t- 检 验 : 双 样 本 等 方差 假设 ”对 话 框 


单 击 “ 确 定 ”按钮 ， 得 到 如 图 6.15 所 示 的 统计 结果 。 y 
: 双 样 本 等 方 其 优 设 | 


3.166666667 sa Êi 
8. TR 64705882| 


18| 





7. 5059; “S 
SA 


Na 
43523 
et 5E-06 
Ki 701130908 


\/ 2. 5531E-06 
2. 048407115 
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A 图 6.15 taR 到 

根据 图 6.15， 分 es - 量 值 为 = -4.8031 。 

第 三 步 : 根据 计算 的 检验 统计 值 ， 计 算 

备 择 假设 为 本 个 总 体 均值 之 差 不 等 TOADER. WER 615, sa 
双 侧 检验 所 对 应 的 值 2553 1x1034 Ç 

第 四 步 :* 统计 决策 。 

P=2.5531x10* <0.01， 拒 绝 原 假设 ， 即 两 个 总 体 均值 之 差 不 等 0， 也 就 是 说 两 个 总 
体 均值 不 相等 ， 说 明 性 别 对 啤酒 综合 印象 分 数 有 显著 性 的 影响 。 


习 是 
一 、 单 项 选择 题 


. 某 厂 生产 的 零件 直径 服从 正 态 分 布 ， 零 件 的 直径 标准 要 求 为 10cm。 某 天 质 检 人 员 从 一 批 生产 的 
机 抽取 25 个 ， 测 得 其 直径 的 均值 为 10.3cm， 检 验 该 批零 件 是 否 合格 ， 则 下 列 正确 的 假设 形式 





县 
A  )。 
A. H,:#=10; Hi:u#10 B. H,:#210; H,: u <10 
C. H;:#<10; H,:#>10 D. H,:#2>10; H,:# <10 


2. 据 有 关 部 门 估计 该 城市 拥有 汽车 比例 为 20%， 然 而 有 人 认为 这 个 比例 实际 上 还 要 高 ， 要 检验 该 说 
法 是 否 正确 ， 则 假设 形式 为 ( )- 


SEE 


统计 学 人 ) messa 








A. H;:m=02; Hi:x#0.2 B. H,:#=02; R.:#2> 02 

C. H¿:z202; H.:z<02 D. H,:z<02; Hi:zr>02 
3. 对 总 体 参 数 的 具体 数值 所 做 的 陈述 称 为 ( 。 )- 

A. 假设 B. 参数 估计 C. 假设 检验 D. 双 侧 检验 
4. 利用 样本 的 信息 来 检验 总 体 参数 的 假设 过 程 称 为 ( 。 )。 

A. 假设 B. 参数 估计 C. 假设 检验 D. 双 侧 检验 
5. 备 择 假设 通常 是 指 研究 人 员 ( — ). 

A. 想 收集 证 据 要 支持 的 观点 B. 想 收集 证 据 要 反对 的 观点 

C. 想 要 支持 的 一 个 正确 的 观点 D. 想 要 反对 的 一 个 正确 的 观点 
6. 原 假设 通常 是 指 研究 人 员 ( 。 )。 

A， 想 收集 证 据 要 支持 的 观点 B. 想 收集 证 据 要 反 = 

C. 想 要 支持 的 一 个 正确 的 观点 D. Re 观点 
T. 下列 说 法 错误 的 是 ( — )。 SAN 

A. 在 假设 检验 中 ,“=” 总 出 现在 原 假设 中 Ni 

B， 在 假设 检验 中 ， 原 假设 和 备 择 假设 是 “eq 

C. 在 假设 检验 中 ， 原 假设 和 备 择 假设 只 N 

D. 在 假设 检验 中 ,“= ee 以 出 现在 备 择 假设 中 
8. 在 假设 检验 中 ， 如 果 备 择 假设 中 出 现 “> 出 称 为 ( — )。 

A. 单 侧 检验 B. 右 侧 检验 % C. 左 侧 检验 D. 双 侧 检验 
9. 在 假设 检验 中 ， 如 果 备 择 假 ; AN ”， 则 称 为 ( eaa 

A， 单 侧 检验 e G. RP D， 双 侧 检验 
10， 在 假设 检验 中 ， 如 果 禾 摊 入 设 站 册 现 “=* ”， 则 称 光 “Sq 

A. 单 侧 检验 右 侧 检验 C. D. 双 侧 检验 
11. 下 列 检 验 ， 属 于 双 nn )， y 

A. HurŠ02; H:r#02 X% X“ H:n <02; H,:z>02 

š H:n 0.2; H,:z<02 小 人 D. Ho:r<02: Hi:z>02 

12. De 属于 左 侧 栓 验 的 是 )。 T 

A. À, :z=0.2: H,:z 0.2 B. H,:z<0.2; H,:z>0.2 

C. H.,:#2>02, H,:g<02 D. H,:z<0.2; H,:z> 0.2 
13. 下 列 检 验 ， 属 于 右 侧 检验 的 是 ( — )- 

A. H;:m=02; Hi:x#0.2 B. H,:z<02; H,:z>0.2 

C. H,:#2>02; Hi:x<02 D. Ho:x<02; H,:#2>0.2 


14. 在 假设 检验 中 ， 第 I 类 错误 是 指 (  )- 
A. 实际 上 原 假 设 是 正确 的 ， 而 拒绝 了 原 假设 
B. 实际 上 原 假 设 是 正确 的 ， 不 拒绝 原 假设 
C. 实际 上 原 假设 是 错误 的 ， 拒 绝 原 假设 
D. 实际 上 原 假设 是 错误 的 ， 而 不 拒绝 原 假设 

15. 在 假设 检验 中 ， 第 工 类 错误 是 指 ( 。“)。 
A. 实际 上 原 假设 是 正确 的 ， 而 拒绝 了 原 假设 
B. 实际 上 原 假设 是 正确 的 ， 不 拒绝 原 假设 
C. 实际 上 原 假设 是 错误 的 ， 拒 绝 原 假设 
D. 实际 上 原 假设 是 错误 的 ， 而 不 拒绝 原 假设 




















16. 在 假设 检验 中 ， 样 本 容量 不 变 的 条 件 下 ， 第 工 类 错误 和 第 开 类 错误 的 发 生 概率 ( ) 

















A. 可 以 同时 减 小 B. 不 能 同时 减 小 

C. 可 以 同时 增 大 D. 只 能 同时 增 大 
17. 拒绝 原 假设 的 检验 统计 量 的 所 有 可 能 取 值 的 集合 ， 称 为 ( )- 

A. 拒绝 域 B. IMRE C. 不 拒绝 域 D. 显著 性 水 平 
18. 在 假设 检验 中 ， 对 于 犯 第 I 类 错误 的 概率 ， 我 们 称 为 (。 ) 

A. 显著 性 水 平 B. 拒绝 域 C. 置信 水 平 D. 不 拒绝 域 





19， 下 列 关于 值 说 法 正确 的 是 (。。)。 
A. 值 越 大 ， 不 拒绝 原 假设 的 可 能 性 越 大 
B. 己 什 越 小 ， 拒 绝 原 假设 的 可 能 性 就 越 大 
C. 己 值 越 小 ， 不 拒绝 原 假设 的 可 能 性 就 越 小 入 
D。 己 值 越 大 ， 不 拒绝 原 假设 的 可 能 性 越 小 , 
ia 放生 下， me >. 
A. Z= t= 





B. Z=% 

















T e n sIn 
al 在 总 体 方 关 示 知 ， 大 样本 的 情况 下 ， TR )。 


Xho 
A. Z= B. ` 
Pr “T > sia s? INn 


22， 在 总 体 服从 正 态 分 布 ， ASS sewa: 况 下 ， TE ERATE E 





) 
x 











A z- WAS Dgs PNA 
23， 大 样本 的 情况 下 ， 检 验 总 体 比例 前 统计 量 是 ( yy ç. 

A. 标准 正 态 „Ý B< i e L D. z: 
24. 检验 一 个 正 态 总 a R pa 

A. 标准 正 态 B. D. 2 
25. 利用 P 了 统计 决策 时 ， maneni i Je 

B. P>a C. P=a D. P=a=0 

26. o CIN T. )。 

A. P<a B; Po C: Ps D. P=a=0 


二 ， 简 答题 


1， 简 述 传统 假设 检验 的 步骤 。 

2. 在 假设 检验 中 ， 当 样本 容量 一 定 的 情况 下 ， 是 否 可 以 同时 减 小 第 1 类 错误 和 第 开 类 错误 的 发 生 概 
率 ， ei 

.总 结 出 不 同情 况 的 总 体 均值 的 假设 检验 统计 量 。 

4. UKER, Hir% 为 例 ， 试 写 出 其 假设 检验 的 过 程 。(w = 0.05 ) 





三 . 判断 分 析 题 


1. 一 个 制造 商 想 要 检验 新 方法 生产 的 零件 直径 是 否 比 旧 方法 生产 的 零件 直径 方差 (0.001 56mm2) 降 低 
了 ， 从 新 生产 方法 中 随机 抽取 100 个 零件 作为 样本 ， 测 得 零件 的 直径 方差 为 0.002 1lmm?。 其 检验 的 过 程 
如 下 。(w=0.05) 
(1) 提出 原 假设 和 备 择 假 设 。 
H,:o? <0.00156; H,:o? > 0.00156 





NK) 


统计 学 人 ) mesas — 


(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 
2_(n-1)S° 99x0.00211 
© œ 0.00156 
(3) ga=0.05 ， 确 定 拒绝 原 假设 的 区 域 。 
从 备 择 假 设 中 可 以 看 出 此 处 是 右 侧 检验 ， 所 以 拒绝 域 为 (x(n 一 1),+%) ， 其 中 za (09) 查 表 得 
Zoos (99) =123.225 2 ， 所 以 拒绝 域 为 (123.225 2,+oo) 。 
(4) 统计 决策 。 
和 =133.9> Xoos*(99)=123.225 2 ， 所 以 拒绝 原 假设 。 
试 判断 这 个 制造 商 的 检验 过 程 是 否 正 确 。 如 果 不 正 确 ， 请 写 出 正确 的 过 程 。 
2. 某 研究 人 员 为 了 检验 总 体 均 值 是 否 大 于 的 一 个 假设 值 10， 从 总 体 方差 未 知 中 抽取 一 个 样本 容量 为 
25 的 样本 ， 测 得 其 样本 均值 为 11， 标 准 差 为 5。 其 检验 的 过 程 如 下 。 “NS 


(1) 提出 原 假设 和 备 择 假设 。 i 
Hy: u <10; H,:>10 N 


O 构造 检验 的 统计 量 ， 并 计算 其 值 。 x< 


z=x-# -l-10 1 
s/n < 
G) w=0.05 ， 确 定 拒绝 原 假设 的 区 域 。 nN 
备 择 假 设 中 可 以 看 出 此 处 是 右 侧 检验 ， 所 以 拒 经 为 (Z,,+%m) ， 其 中 Z, 查 表 得 Zuo =1.645 ， 所 以 拒 


=133.9 























绝 域 为 (1.645,+oo) SS 
(4) 统计 决策 。 、 S p 
Z=1< 2oos =1.645 ， 所 以 不 拒绝 床 很 设 。 x 
个 研究 人 只 的 格物 和。 如 果 不 正 确 ， Wami 外 的 过 程 。 
r cg 
四 、 计 算是 AK1 


1. REAS h EER ARA EPpLtüEfE 2 年 或 24 000km 内 无 事故 "， 但 汽车 
的 一 个 经 销 商 认为 神 证 “2 E” ER R AEAEE 004 fE 2 年 内 行驶 的 平均 里 程 超过 
24000kn .为了 二 这 一 说 法 ， 访 经 销 商 随机 抽取 36 位 顾客 , 测 得 这 35 位 顾客 在 2 年 内 行驶 的 里 程 均 
值 为 245 00kfn》 标准 差 为 600km， 取 显著 性 水 平 a =0.05 ， 对 该 问题 进行 假设 检验 。 

2。 一 项 研究 发 现 ，2013 年 新 购买 小 汽车 的 人 中 有 50% 是 女性 ， 在 2014 年 所 做 的 一 项 调查 中 ， 随 机 
抽取 了 120 个 新 车 主 中 有 71 人 为 女性 ， 在 w= 0.01 的 显著 性 水 平 下 ， 检 验 2014 年 新 车 主 中 女性 的 比例 是 
否 显著 性 增加 。 

3。 一 项 调查 表明 ，2 年 前 每 个 大 学 生 的 上 网 平均 时 间 为 6.7h， 而 最 近 对 200 个 大 学 生 上 网 的 时 间 调 
查 结果 是 ， 每 个 大 学 生 每 天 上 网 的 平均 时 间 为 7.25h， 标 准 差 为 2.5h， 在 显著 性 水 平 a=0.01 下， 检验 现 
如 今 大 学 生 每 天 平均 上 网 时 间 有 无 显著 性 的 增加 。 

4。 一 项 新 型 减肥 方 法 宣称 参加 者 在 一 个 月 内 平均 能 减 去 8g。 为 了 验证 该 说 法 ， 某 研究 人 员 随 机 抽取 
了 由 25 人 使 用 该 方法 减肥 的 人 组 成 样本 ， 测 其 平均 减 重 为 7kg， 标 准 差 为 3.2 kg. TE a=0.01 的 显著 性 水 
平 下 ， 检 验 这 项 减肥 方法 宣称 的 是 否 属实 。 




















五 、Excel 操作 题 


某 企业 为 比较 两 种 方法 对 员工 进行 培训 的 效果 ， 采 用 方法 1 对 15 名 员工 进行 培训 ， 采 用 方法 2 对 12 
名 员工 进行 培训 。 培 训 后 的 测试 分 数 见 表 6-16 所 示 。 


CE 


EP E PT wasu E as OEN EE 


假设 检 可 人 


表 6-16 培训 后 的 测试 分 数 






































方法 1 方法 2 
56 59 
51 57 
42 53 
47 52 
50 57 
43 68 
41 54 
56 59 
52 53 
50 54 
46 62 
48 57 
47 = 
45 = 
46 一 





在 a=0.01 的 显著 性 水 平 下 , 检验 两 种 方法 的 培训 效果 是 否 存在 显著 性 的 差异 。( 提 示 : 首先 要 检验 两 
个 总 体 的 方差 是 否 相等 ， 之 后 再 检验 两 种 访 法 的 培训 效果 是 否 存在 显 洗 性 的 差异 ) 
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第 f = 方差 分 析 


学 目标 ) 


1， 掌 所 方差 分析 的 基本 问题 . CK 
2， 掌 握 单 因素 方差 分 析 . A 
3. 掌握 方差 分 析 中 的 多 重 比较 = 
NAS W 
sN, XN 
ESAP ) ; KY 
K 
SN 


这 种 影响 


性 别 与 某 亲 课程 成 绩 pa 


IA < K 
某 高 校 经 济 学 专业 的 3 名 学 生 /决定 研究 性 别 与 某 门 课程 成 绩 高 
> 2 


程度 又 如 何 呢 ? 


香 有 关系 ?如 果 存 在 关系 的 话 
XS Xx 


调查 的 对 象 是 该 接 几 涯 过 此 课程 的 几 个 专业 的 学 祥 术 的 抽取 方式 是 分 层 抽样 与 简单 随机 抽样 结 


合 ， 先 根据 年 级 划 闪 层次 ,然后 对 名 个 班级 作 简 间 随 机 灿 料 7 共 拍 取 150 名 学 生 组 成 一 个 样本 ， 然 后 对 每 
pnm y s 
VW 


5 
表 7-1 问卷 调查 汇总 表 


/ 
a | e | v] sü np | — | = 
# | | s | — [L s L | 


其 中 ， 男 生 的 样本 量 为 90 人 ， 女 生 的 样本 量 为 60 A. 
这 里 涉及 两 个 变量 : 一 个 是 分 类 变量 即 性 别 ， 另 一 个 是 数值 变量 即 成 绩 。 根 据 表 7-1 


的 数据 ， 





你 认为 性 别 与 成 绩 高 低 是 否 有 关系 呢 ? 如 何 来 检验 两 个 变量 之 间 是 否 存在 关系 


呢 ? 学 完 本 章 内 容 就 很 容易 解决 这 样 的 问题 。 





这 


有 以 一 个 例题 引 H 





方差 分 析 的 定义 。 


【 例 7.1】 设 有 4 个 总 体 ， 每 个 总 体 的 均值 分 别 为 ，j,，J4，K4， 试 检验 4 个 总 体 
的 均值 是 否 相 等 。( 显 著 性 水 平 a=0.05 ) 

解 : 刚 学 完 第 6 章 的 内 容 ， 所 以 用 第 6 章 的 假设 检验 ， 但 一 般 的 假设 检验 一 次 只 能 检 
验 两 个 总 体 均 值 是 否 相等 , 即 需要 检验 6 次 , 分 别 为 : 4454: A=: 4h = 44: 4h = 4h: 
=: =M. 





方差 分 析 . se 第 .了 


很 显然 ， 这 样 的 检验 十 分 烦琐 ， 同 时 还 存在 一 个 很 大 的 问题 ， 即 a = 0.05 ， 也 就 是 说 





每 次 检验 允许 犯 第 I 类 错误 的 概率 只 是 0.05， 如 果 检 验 6 次 ， 最 后 得 册 
类 错误 的 概率 将 达到 1-(1-o)' = 0.265 ， 严 本 




















这 是 不 允许 的 。 这 时 就 要 使 用 方 








7.1 


7.1.1 方差 分 析 的 定义 


差分 析 。 


方差 分 析 的 基本 理论 


根据 例 7.1， 可 得 方差 分 析 定义 。 


定义 7.1 检验 多 个 总 体 均值 是 否 相等 的 统计 方法 ， 称 为 方差 分 析 : 





结论 使 我 们 犯 第 I 
超过 了 题目 中 允许 犯 的 第 I 类 错误 的 概率 ， 


方差 分 析 研 究 的 目的 是 什么 呢 ?” 为 了 回答 这 个 问题 ， 来 看 下 面 的 例子 。 

【 例 7.2】 某 大 学 生 毕 业 后 ， 决 定 自主 创业 ， 开 一 家 快餐 店 .| 在 设计 快餐 店 方案 中 ,他 
想 知道 店 的 地 理 位 置 会 不 会 影响 他 的 营业 额 ， 若 影响 ”影响 的 程度 有 多 大 ， 判 断 因 地 理 位 
置 产生 的 收益 会 不 会 大 于 成 本 ， 如 果 没 有 影响 , :在 设计 方案 中 就 不 用 考虑 地 理 位 置 了 。 为 
了 得 到 结论 ， 他 进行 了 市 场 调查 ， 分 别 随机 的 类 不 同 地 理 位 置 抽 取样 本 ， 所 得 数据 见 表 7-2 

















所 示 。 Š 
表 7-2 “不 同 地 理 位 置 的 超市 营业 额 
' Š ‘Pa 单位 : 元 
商业 区 居民 区 
41 000 26 500 
30 500 31 000 
45000 22 000 
38 000 29 000 
31000 35000 
39 000 30 000 
59 000 44 500 
48 000 48 000 
51 000 = 
47 000 = 
41 500 == 
39 000 Z 





试问 ， 地 理 位 置 是 否 对 营业 收入 有 影响 ? 


解 : 这 名 大 学 生 把 地 理 位 置 分 为 3 类 ， 分 别 为 商业 区 、 写 字 楼 和 居 














区 ， 所 以 说 地 理 


位 置 是 分 类 数据 ， 营 业 收 入 是 数值 数据 ， 想 知道 分 类 数据 是 否 对 数值 数据 产生 影响 ， 即 分 





类 数据 是 自 变 量 ， 数 值 数 据 是 因 

















如 果 商 业 区 的 快餐 店 平均 营业 收入 人 、 写 字 楼 区 的 快餐 店 








快餐 店 平均 营业 收入 a E, 3) 

















F 均 营业 收入 jy 和 居民 区 的 


说 明 地 理 位 置 对 营业 收入 没有 影响 ， 如 果 均 值 不 全 相等 ， 
则 意味 着 地 理 位 置 对 营业 收入 是 有 影响 的 。 


的 小 
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通过 上 面 的 分 析 ， 要 想 研 究 地 理 位 置 对 营业 收入 是 否 有 影响 ， 只 需 看 3 个 总 体 的 均值 
是 否 相等 。 而 上 面 的 数据 是 样本 的 数据 ， 所 以 要 用 3 组 样本 数据 来 推导 3 个 总 体 均值 是 否 
相等 ， 其 中 多 个 总 体 均值 是 否 相 等 ， 称 为 方差 分 析 。 

也 就 是 说 ， 方 差分 析 研究 了 分 类 型 自 变 量 对 数值 型 因 变 量 的 影响 ， 即 方差 分 析 采 用 的 
方法 就 是 通过 检验 各 总 体 的 均值 是 否 相等 来 判断 分 析 类 型 自 变量 对 数值 型 因 变 量 是 否 有 显 
著 影 响 。 


7.1.2 方差 分 析 中 的 几 个 基本 概念 


定义 7.2 在 方差 分 析 中 ， 所 要 检验 的 对 象 称 为 因素 或 因子 (factor)。 

定义 7.3 ”因素 的 不 同 表现 称 为 水 平 或 处 理 (treatment)。 7 

定义 7.4 每 个 因子 水 平 下 得 到 的 样本 数据 称 为 观测 值 。 K 

例如 ， 在 例 72 中 要 分 析 地 理 位 置 对 营 和 车 赂 响 。 这 里 的 “地 理 位 置 ” 
是 要 检验 的 对 象 ， 称 为 “因素 ”或 “因子 ”， 商 业 区 3 机 RK 是 “地 理 位 置 ”这 一 
因素 的 具体 表现 ， 称 为 “水 平 ”或 “处 理 ”， 在 和 人 地 区 下 的 样本 数据 (营业 收入 )， 称 
为 观测 值 。 由 于 只 涉及 “地 理 位 置 ”一 个 因素 , - 因 紫 称 为 单 因素 三 水 平 的 试验 。 

在 只 有 - e E A 煌 ) 中 ， 涉 及 两 个 变量 ，@ 分 类 型 自 变 
量 ，@@ 数 值 型 的 因 变 量 

定义 7.5” 当 方差 分 析 中 只 涉及 Mraz, 称 为 单 因素 方差 分 析 。 

除了 单 因素 方差 分 析 之 外 ， 还 有 双 因素 的 方差 因 析 。、 > 

定义 7.6” 当 方差 分 析 昌 涉及 两 个 分 类 自 变量 时 ， HAN ZA MOROU 

例如 ， 在 例 7.2 d, 除 予 研究 地 理 位 置 对 营 A 还 可 能 受 其 他 分 类 数据 的 
影响 , 1382903098, 把 竞争 对 手 的 数量 分 沟 0 个 \ 1 个 、2 个 和 3 个 及 以 上 4 个 水 平 。 
这 时 就 涉及 两 个 个 类 自 变量 ， 称 为 双 因素 友 差 分 析 : 

< T a 
KUAN | 


Tl3 方差 分 析 的 基本 思路 


为 了 分 析 分 类 型 自 变量 对 数值 型 因 变 量 的 影响 ， 需 要 从 分 析 数据 误差 的 来 源 入 手 。 

先 计算 出 3 个 总 体 下 的 样本 均值 ， 即 有 未 =42500, 7, =25250, x, =33250, 3 4 
样本 均值 来 看 ， 商 业 区 的 样本 均值 高 于 居民 区 ， 居 民 区 的 营业 收入 又 高 于 写字 楼 。 但 仅仅 
从 样本 均值 上 观察 ， 还 不 能 提供 充分 的 证 据 证 明 不 同 地 理 位置 对 营业 收入 存在 显著 差异 
因为 这 种 差异 可 能 是 由 抽样 的 随机 性 造成 的 。 因 此 ， 需 要 有 更 准确 的 方法 来 检验 这 种 差异 
是 否 显著 ， 也 就 是 要 进行 方差 分 析 。 

下 面 介 绍 方差 分 析 的 思路 。 

首先 ， 注 意 到 ， 例 7.2 中 的 所 有 观测 值 不 同 ， 存 在 差异 ， 这 种 差异 称 为 总 误差 。 

其 次 ， 注 意 到 在 同一 地 理 位 置 (同一 个 总 体 ) 下 ， 样 本 的 各 观测 值 是 不 同 的 。 例 如 ， 在 
商业 区 中 ， 所 抽取 的 7 家 快餐 店 的 营业 收入 是 不 同 的 ， 这 些 数据 之 间 存 在 差异 ， 这 种 差异 
是 组 内 误差 。 组 内 误差 产生 的 原因 : 由 于 企业 是 随机 抽取 ， 因 此 它们 之 间 的 差异 可 以 看 成 
随机 素 的 有 响 造 成 的 ， 或 者 说 是 由 抽样 的 随机 性 所 造成 的 ， 称 为 随机 误差 。 
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最 后 ， 在 不 同 地 理 位 置 (不 同 总 体 ) 之 间 ， 各 观测 值 也 是 不 同 的 ， 即 数据 存在 差异 ， 称 
这 种 差异 为 组 间 误差 。 组 间 误 差 产 生 的 原因 : 这 种 差异 也 可 能 是 由 抽样 的 随机 性 造成 的 ， 
除 此 之 外 ， 还 可 能 是 由 地 理 位 置 本 身 造成 的 ， 后 者 所 形成 的 误差 是 由 系统 性 因素 造成 的 ， 






































从 上 面 的 分 析 中 可 以 看 出 ， 组 间 误差 和 组 内 
误差 共同 构成 了 总 误差 ， 如 图 7.1 所 示 。 

如 果 不 同 地 理 位 置 对 营业 收入 没有 影响 ， 那 + 
么 组 间 误 差 只 包含 随机 误差 ， 而 没有 系统 误差 。 。 OWN (HHDIRSETE Rina) 
如 果 不 同 地 理 位 置 对 营业 收入 有 影响 ， 那 么 组 间 
误差 中 就 包含 系统 误差 。 即 研究 分 类 自 变 量 ( 地 理 四 ”1 SRS ATRZMAARENAA 
eA ERR 即 系统 误差 大 
小 是 否 为 0。 

想得到 系统 误差 的 大 小 值 ， 只 需 计算 出 组 内 误差 的 ei 如 果 它 们 
的 比值 接近 1， 有 随机 误差 = 随机 误差 + 系统 误差， a 的 大 小 为 0， 不 存在 系统 误 
差 ， 反 之 ， 组 间 误 差 大 小 大 于 组 内 误差 大 小 ， .. 9 比值 就 会 大 于 1。 当 这 个 比值 大 
到 森 种 程度 时 ， 即 存在 系统 误差， 也 就 是 1 同 水 平 之 间 存在 显著 差异 ， 即 自 变量 
对 因 变 量 有 影响 。 

定义 77 EERTE ARPM, 1029 SSA。 它 反 
映 不 同 水 平 之 间 的 离散 状况 。 

定义 7.8 反映 全 部 数据 的 泊 关 人 小 ， e i SST。 它 反映 全 部 数据 的 
总 离散 状况 。 , X X 

定义 79 反映 误差 大 小 的 平方 和 ， 称 鸭 组 内 平方 和 ， 记 为 SSE. 它 反映 了 每 个 
样本 内 各 观测 值 的 总 离散 状况 。 x N 


Ç 
7.14 的 条 件 £ > 

方差 分 析 中 有 3 个 基本 的 假定 

1. 每 个 总 体 都 应 服从 正 态 分 布 

也 就 是 说 ， 对 于 因素 的 每 一 个 水 平 ， 其 观测 值 是 来 自 正 态 分 布 总 体 的 简单 随机 样本 。 

例如 ， 在 例 7.2 中 ， 每 个 地 理 位 置 的 营业 收入 必须 服从 正 态 分 布 。 

2. 方差 齐 性 

方差 齐 性 是 指 每 个 总 体 的 方差 相同 ， 也 就 是 说 ， 对 于 各 组 观察 数据 ， 它 们 是 从 具有 相 
同方 差 的 正 态 总 体 中 抽取 的 。 

例如 ， 在 例 7.2 中 ， 每 个 地 理 位 置 的 营业 收入 总 体 方 差 都 相同 。 

3. 观测 值 是 独立 的 

例如 ， 在 例 7.2 中 ， 每 个 被 抽 中 的 快餐 店 的 营业 收入 与 其 他 的 快餐 店 营业 收入 相互 独 
立 ， 没 有 任何 关系 。 

设 例 7.2 中 的 商业 区 的 所 有 快餐 店 为 总 体 为 了 ， 则 XY 一 N(j4,0*); 写字 楼 的 所 有 快餐 
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gas (Q msg 


EIRE X, W XS Nu, ):; ERKENE REGIA X, WA X,—N(u,o2) 
且 3 组 样本 的 观测 值 是 相互 独立 的 。 


72 单 因素 方差 分 析 


721 ”数据 结构 

在 进行 单 因素 方差 分 析 时 ， 需 要 得 到 下 面 的 数据 结构 ， 为 叙述 方便 ， 在 单 因素 方差 分 
析 中 ， 用 A 表示 因素 ， 因 素 的 个 水 平 (总 体 ) 分 别 用 A,A,,…,A, 表示 ， 每 个 观测 值 
(i=12,…,kj =1,2,…,n) 表示, 即 x, 表示 第 i 个 水 平 (总 体 ) 的 第 j 个 观测 值 。 例 如 ，x, 表 
示 第 2 个 水 平 的 第 1 个 观测 值 。 其 中 ， 从 不 同 水 平 中 抽取 的 样本 容量 本 以 相等 ， 也 可 以 不 
相等 。 每 一 水 平 下 的 样本 容量 为 n, o Ñ š: 

在 例 7.2 中 ， 地 理 位 置 是 因素 ， 因 素 有 3 个 不 同 水 平 从 即 大 =3 ， 商 业 区 为 A, ， 写 字 楼 
为 A,， 居 民 区 为 A; ， 其 中 商业 区 的 样本 容量 为 由 =12 习 写字 楼 的 样本 容量 为 几 =10， 居 
民 区 的 样本 容量 为 n, =8。 数 据 结构 见 表 7-3 MAX 































































































表 7-3 单 因素 方差 分 析 数 据 结 构 
商业 区 A; “写字 楼 A。 居民 区 A, 


An ow) 
30 500( x, ) } 31000(x,) 
swo — | 3300 7 rey 
38 0007y) — 29 000( x,, ) 
SOC 0C) 
D T 
EAE CELES 
Ac Tc 


51 000( x,) 
47 000( x, ) 
41 500( x.) 
39 000( x; ) 























7.2.2” 单 因素 方差 分 析 的 基本 步骤 


方差 分 析 是 检验 自 变量 对 因 变 量 是 否 有 显著 影响 ， 既 然 是 检验 就 要 满足 假设 检验 的 4 
个 步 又。 

(1) 提出 原 假设 H, 和 备 择 假设 瓦 。 

(2) 构造 检验 统计 量 ， 并 计算 其 值 。 

(3) 根据 给 出 的 显著 性 水 平 wx ， 确 定 拒绝 原 假 设 的 区 

(4) 统计 决策 。 


























又 
pan 


Mp/ 


PE ansa f 


1. 提出 原 假设 及, 和 备 择 假 设 H, 


确定 方差 分 析 的 原 假设 H, 和 备 择 假 设 H 时， 同样 要 从 备 择 假设 入 手 ， 备 择 假设 是 指 
研究 人 员 了 予以 支持 的 观点 。 
在 前 面 已 介绍 ， 方 差分 析 是 检验 多 个 总 体 均值 是 否 相等 的 ， 研 究 人 员 认 为 分 类 自 变量 
对 数值 因 变 量 是 有 影响 的 ， 所 以 方差 分 析 的 原 假设 和 备 择 假设 内 容 如 下 。 
H: 4 =4, == Hg: Hi:44,14，… Ux 不 全 相等 。 原 假设 表明 分 类 自 变 量 对 数值 因 变量 没 
有 显著 影响 ， 备 择 假 设 表明 分 类 自 变 量 对 数值 因 变 量 有 显著 影响 。 其 中 ， 为 第 i 个 总 体 
的 均值 。 

如 果 拒 绝 原 假设 ， 则 意味 着 自 变量 对 因 变 量 有 显著 影响 ， 也 就 是 自 变 量 与 因 变量 之 间 
有 显著 关系 : 如 果 不 拒绝 原 假设 ， AR AR K 显著 影响 ， 也 就 是 不 
能 认为 自 变量 与 因 变 量 之 间 有 显著 关系 。 

注意 : 在 备 择 假设 中 ， 要 理解 好 “不 全 ”， > “不 全 ”是 指 至 少 有 两 
个 总 体 的 均值 不 相等 就 可 以 ， 而 “全 不 ” Sa 之 间 全 都 不 相等 。 









































2. 构造 检验 的 统计 量 ， 并 计算 其 值 PON 
ee 条 内 标 准 正 态 分 布 、 刀 分布、 分 布 和 严 分 
hi 4 个 分 布 之 一 ， ae s aane 如 果 含有 未 知 数 ， 无 法 计算 出 


方差 分 析 的 思路 。 把 研究 分 类 自 变量 对 数值 因 靶 量 是 否 有 影响 ， 转 为 研究 系统 误差 的 
大 小 是 否 为 零 ， 而 要 想 和 算出 系统 误差 的 大 小 \\ 必 须 i 算 组 间 误 差 大 小 (组 间 平方 和 ) 和 组 
Q ` 方 和 )， 再 将 两 者 进行 比值 ，。 

1) ik: 小 ST 

0) 组 et 

组 内 平方 和 是 衡量 同一 水 平 下 数据 差异 大 小 的 总 误差 ， 即 求 出 方差 分 析 中 每 一 水 平 的 
误差 大 小 之 和 ， 要 想 计 算出 每 一 水 平 的 数据 差异 ， 首 先 要 计算 出 每 一 水 平 的 样本 平均 值 。 

© 计算 因素 各 样本 的 均值 。 

设 天 为 每 一 水 平 下 的 样本 均值 ， 则 有 每 一 水 平 的 样本 均值 : 


Ès 
x =4&—i=l,2,-,k (7.1) 
n, 
式 中 ，n 为 第 i 个 总 体 的 样本 容量 ，x 为 第 i 个 总 体 的 第 j 个 观测 值 。 


@ 计算 每 一 水 平 下 的 组 内 误差 大 小 。 
设 每 一 水 平 的 组 内 误差 大 小 为 SSE, (i=1,2,…,k) 


检验 统计 量 的 数值 。 公司 
如 何 构造 这 一 oa em 造 这 一 检验 的 统计 量 。 




















SSE, = >G _ x) (7.2) 


Ww 
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图 计算 组 内 平方 和 。 





SSE = ÈSSE, = -$20 - y (7.3) 


(2) 组 间 平 方 和 。 

组 间 平 方 和 是 衡量 不 同 水 平 之 间 的 数据 差异 大 小 。 

D 计算 全 部 观测 值 的 总 平均 值 。 

全 部 观测 值 的 总 平均 值 是 全 部 观测 值 的 总 和 除 以 观测 值 的 总 个 数 。 总 平均 值 表示 为 xX 。 














ÈS Dny, 
x= -a — I (7.4) 
n n 
式 中 ， n=n +n, + +n, ° 7 K 
@ 计算 组 问 平方 和 。 AN 
k 
SSA= Yn @% Ky (7.5) 
(3) 总 平方 和 。 
总 平方 和 是 衡量 所 有 观 Miama 大 人 的 AN 天 和 的 公式 为 
(7.6) 
mae 六 
> Ç p S SST=SSE +SSR-, X (7.7) 


ny ⁄* 
A —x) -Èn (x, zA Èo- 
> MENAN x N 
| 路 可 知 ， PE L A T 

方差 J 1 提 条 件 有 3 个 : 一 是 正 态 性 ， 每 个 总 体 都 要 服从 正 态 分 布 ; 二 是 方差 齐 性 ， 
每 个 总 体 的 方差 相同 ; 三 是 观测 值 相 互 独立 。 

根据 总 体 服 从 正 态 分 布 , 方差 齐 性 ,可 以 推出 每 个 总 体 下 的 样本 均值 均 服 从 正 态 分 布 ， 
又 因为 有 


























SSE SSe - x) 


il jal 


k 
SSA = n,(x, — x) 
i=l 


SST -$F -x 


i=l jal 


可 推出 3 个 平方 和 都 是 服从 和 分 布 的 ， 即 有 


Cu 


PE ant : 


SSE “S SG =x, ~z (n-k) 


i JaA 


SSA= Yn -x)'— z (k- D (7.8) 


isl 


SST Sy —x) ~zx(n-l) 


式 中 , 为 因素 的 不 同 水 平 的 数目 为 全 部 观测 值 的 个 数 。 
检验 的 统计 量 要 从 组 间 平 方 和 和 组 内 平方 和 的 比值 入 手 ， 而 它们 都 是 服从 廊 分 布 的 ， 
所 以 得 到 的 检验 统计 量 为 














SSA /(k-1) 1) 
F= SSE/n A) ~F(k-1,n-k) 从 (7.9) 
定义 7.10 平方 和 除 以 相应 的 自由 度 ， 称 为 均 方 ， 用 
所 以 式 (79) 中 的 SEE 人 称 为 组 间 均 方 ， ss ) 即 有 


= ln-k) (1.10) 


 SSE/(n— _ k) 
3. 根据 给 出 的 显著 性 水 平 w ， wi i 
因为 是 右 侧 的 单 侧 检验 ， ee 
天 一 1 k),+oo 
y, < Bi(k-ln-k) VAP 
4. 统计 决策 ,YX 
4 F> F,(k 1 ms Je RREY epee 所 以 拒绝 原 假设 ,由 
接受 备 择 假设 ,意味 着 分 类 自 变量 对 数值 园 变 量 是 有 影响 的 ; 5 F < F, Ln- D), BA 
落 在 拒绝 原 假设 的 区 域 中 ， 不 拒绝 原 人 六 有 充足 的 证 据 证 明 分 类 自 变 量 对 数值 因 变 量 
有 影响 。 
【 例 73] 沿用 例 7.2， 检 验 地 理 位 置 对 快餐 店 的 营业 收入 是 否 有 影响 。 显 著 性 水 平 
a=0.05. 
解 : 
(1) 提出 原 假设 ,和 备 择 假设 r. 
H, : 4, = 4, = 4 
H, : 4h, ha, py PEISE 
(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 
@ 计算 组 内 平方 和 。 


























ni 


>x 





xi=—i=1,2,---,k 
n, 


x. =42500; x,=25250; x,=33250 


SSE= YssE, -YY gy 
i=l 


isl jal 


Ana 


统计 学 (O mes 


SSE = 7 255 000 + 22 978 500 + 5 530 000 = 15 082 850 
@ 计算 组 间 平 方 和 。 





37, Èm 
x== = 34283 
n n 








HH, n=n +n, +n, =30 
k 
SSA= n(x —x)° 
izi 


=12x (42 500 — 34 283)? +10 x (25 250 — 34 283)? + 8 x (33 250 — 34 283)? 
=1634 717 000 
© 总 平方 和 。 


SST= yx - x) 


或 SST=SSE+SSR =31430020 
@ 检验 的 统计 量 为 
_SSA/(k— l) 
~ SSE/(n—h) 
_ 1634717000/2-_ 81735.83 
1508285000127 5586.241 
(3) 根据 给 出 的 显著 性 水 平 a, 确定 拒绝 原 假设 的 区 域 % 
(F. (k —1,n— k),*@) 
查 政 统计 分 布 表 得 F, (2,27)=3354131, ， 所 以 拒绝 域 为 (3.354 131+oo) o 
(4) 统计 决策 3 a 
因为 尺 =14.631 63 > os(2,27)=3.3 针 13L， 落 在 拒绝 原 假设 的 区 域 中 ， 所 以 拒绝 原 假 
设 ， 即 分 类 自 变 量 对 数值 因 变 量 有 影响 ， 也 就 是 说 ， 地理 位 置 对 快餐 店 的 营业 收入 有 影响 。 
在 单 因素 方差 分 析 中 , 也 可 以 使 用 己 值 进行 决策 , 这 时 只 需 改变 方差 分 析 中 的 第 三 步 ， 
根据 得 出 的 检验 统计 量 值 计算 P 值 ， 把 P 值 与 显著 性 水 平 a 相 比 ， 进 行 决策 即 可 。 


7.2.3 方差 分 析 表 


G cp 通常 将 上 述 过 程 列 在 一 张 表 内 ， 即 方差 分 
析 表 ， 其 一 般 形 式 见 表 7-4 所 示 。 


Bp E) 





=14.63163 














表 7-4 方差 分 析 表 










上 临界 值 
F,(k-1,n-k) 


F 值 
MSA/ MSE 


自由 度 df | 均 方 MS 
k-1 MSA 
n-k MSE 

































gal 


则 例 7.3 的 计算 结果 可 列 成 见 表 7-5 所 示 的 方差 分 析 表 。 


MP/ 


PE ant 


表 7-5 不 同 地 理 位 置 的 超市 营业 额 方差 分 析 表 































误差 来 源 | 平方 和 SS 均 方 MS FÈ Pë FARA 
组 间 1634717 000 2 817358300 | 14.63163 | 495878E-05 | 3.354131 
组 内 | 1508285000 | 55862 410 | 





3143 002 000 





总 计 


从 上 面 的 方差 分 析 可 以 得 出 两 种 决策 的 方法 : 
(1) F =14.631 63 > 局 ws(2,27)=3.354131， 所 以 拒绝 原 假设 。 
(2) P=4.95878E -05 < a=0.05 ， 同 样 拒绝 原 假设 。 


7.2.4 “关系 强度 的 测量 2 


例 7.3 的 方差 分 析 结 果 显示 ， ARTE AIRE A E AE, 
这 意味 着 地 理 位置 对 快餐 店 的 营业 收入 是 有 影响 的 ， 既然 影响 ， 通 常 要 知道 地 理 位 置 对 
营业 收入 的 影响 程度 。 因 为 除了 地 理 位 置 对 快餐 店 营 营业 收入 看 影 响 之 外 ， 还 有 其 他 因素 影 
响 营 业 收 入 ， 即 想 知 道 地 理 位 置 对 营 if 业 收入 影响 当 所 有 影响 营业 收入 的 因素 的 E 

那么 , 如 何 量度 它们 之 间 的 关系 zo n whi 自 变量 s SS 
占 总 平方 和 (SST) 的 比例 大 小 来 反映 。、 







































其 平方 根 尺 就 可 以 KAIN MINX RAS, RREK, RERRHLEK: 
如 果 R 越 小 ， 代 表 关系 强度 越 小 。 KAA 


BER = SSA mjsto. N Á 


[6J74) AOI 73 中 的 数据 ， 计算 地 
i: pR = SSA -1634717000 _ 


= SST 3143002000 ` 
也 就 是 说 ， 地 理 位 置 对 快餐 店 的 营业 收入 的 影响 占 总 效应 的 52%. 


7.2.5 多重 分 析 比 较 


通过 上 述 的 分 析 得 出 的 结论 是 ， 不 同 地 理 位 置 的 快餐 店 营业 收入 的 均值 是 不 相同 的 。 
但 究竟 哪些 均值 之 间 不 相等 呢 ? 这 种 差异 到 底 出 现在 哪些 地 理 位 置 之 间 呢 ? 也 就 是 说 ， 
由 与 如 44h 与 后 之 间 究 竟 是 哪 两 个 均值 不 同 呢 ? 这 就 需要 做 进一步 的 分 析 , 此 时 所 
用 的 方法 就 是 多 重 比较 方法 。 它 是 通过 对 总 体 均值 之 间 的 配对 比较 来 进一步 检验 到 底 哪些 
均值 之 间 存 在 差异 。 

多 重 比较 方法 有 许多 种 ， 本 书 主要 介绍 由 费 希 尔 (Fisher) 提 出 的 最 小 显著 差异 方法 ， 简 
记 为 LSD。 全 既然 是 检验 ， 就 要 满足 假设 检验 的 4 个 步骤。 

第 一 步 : 提出 原 假设 和 备 择 假设 。 

从 备 择 假设 入 手 ， 所 以 提出 的 原 假设 和 备 择 假设 内 容 如 下 : 

H,:4;=4;; H: 4; #4; G= j: ij=1,2;3) 





位 置 对 快餐 店 的 影响 程度 有 多 大 。 




















SS 


ee 


第 二 步 : 构造 检验 统计 量 ， 并 计算 其 值 。 
检验 的 统计 量 从 检验 内 容 的 样本 入 手 ， 所 以 其 检验 的 统计 量 如 下 : 
x-5; 
第 三 步 : 根据 给 出 的 显著 性 水 平 a 的 数值 ， 确 定 拒 绝 原 假设 的 区 域 。 
由 第 一 步 可 得 出 ， 该 检验 为 双 侧 检验 ， 则 费 希 尔 的 拒绝 原 假设 区 域 为 
(-%, -LSD)U (LSD,+%) 


LSD=1,,(n-h) [Mse +5 (7.12) 
n, n; 


tus(n 一 有 为 + 分布 的 临界 值 ， 可 以 通过 查 1 分 布 表 得 到 ， 其 自由 度 为 n-k， 其 中 为 因素 
中 水 平 的 个 数 ，MSE 为 组 内 均 方 ，n, 、n, 是 第 i 个 样本 和 第 j 个 样本 的 料 本 容量 。 
第 四 步 : 统计 决策 。 S5 
S EER Se 绝 原 假设 否则， 不 拒绝 原 
But > \ 
【 例 7.5】 沿用 例 7.3 中 的 数据 ， 试 找 N 位 置 的 快餐 店 营业 收入 均值 不 相同 。 
CEH VEK F a =0.05) j K , 
解 : x 
(1) 提出 原 假设 和 备 择 假设 s A =Q 
检验 1: Hai =p: Haz XXX 
检验 2; H; = 4h Hh ” ÚX 
检验 3: H, :44 n; Hi: 4, > ph XL 
D 构造 检验 的 统计 量 ， 并 计算 其 值 。-_ Ne 
检验 SS 500—25 250= U2 
检验 2 NE 一石 =42500-33250=9250 
检验 3: X, — 7, =25 250-33 250 = -8 000 
(3) 根据 给 出 的 显著 性 水 平 a 的 数值 ， 确 定 拒绝 原 假设 的 
(=%,-LSD) U (LSD,+%) 


检验 1，LSD =t,(n-k) vse [+] 
n, n, 
| 下 
= 加 os(27) |55 862 me + 5) 


= 2.373 417 186x ,155 862 410x[ 吉 + 二 | 
12 10 





其 中 LSD 的 计算 公式 为 





















































区 
ÉE 





=7595.47 
所 以 拒绝 域 为 (-oo,-7 595.47) U (7 595.47,+oo) 。 


检验 2: LSD=tL,,(n-k) vse) 
n n, 


EW 


PE ans f 


= 2.373 417 186 x |55862 aox E+) 
12 8 


=8 096.80 
Fir LAFE ZEER Y (—0, —8 096.80) U (8 096.80, +20) 。 


检验 3，LSD =t, (n-k) mse[ + 1) 
n mw, 


=2.373417186x ss862410x[ 二 + 
10 8 





=84.1444 
所 以 拒绝 域 为 (oo0,_8 414.44) U (8 414.44, +00) 。 2 
(4) 统计 决策 。 T 

检验 1: x —x,=17250 > 7595.47 , PONR AIRA Îl 4i A, o 


382; x —x,=9250 >8096.80, LIES R E a # pa o 
检验 3: 7-7 =-80 -8414.44， 所 以 不 拒绝 原 假设 ， 即 /4 = 5. 
根据 以 上 的 分 析 ， 最 后 该 大 学 生 选 择 的 和 理 位 置 如 果 是 j 业 区 ， 则 他 的 营业 收入 会 达 


到 最 大 。 xs 


mr 
7.3 案例 分 析 : | 哮 泣 市 场 的 调查 与 分 析 及 Excel 上 机 应 用 
,于 一 啤酒 印象 与 学 历 的 相关 性 分 析 
rA 
在 第 4 005004), DATERA DÉNEN, mayitiqspkur F, KE, 
本 科 和 研究 生 及 BE 4 组 的 啤酒 综合 印 每 分 数 据 进行 描述 性 分 析 ， 得 出 的 结论 是 ， 高 中 
及 以 下 啤酒 的 平均 印象 分 数 最 高 ， 其 次 是 研究 生 及 以 上 的 平均 分 数 ， 再 次 是 大 专 的 平均 分 
数 ， 最 小 的 是 本 科 的 平均 分 数 ， 但 4 组 样本 平均 分 数 还 不 能 说 明 学 历 对 啤酒 综合 印象 分 数 
有 影响 。 通 过 学 习 本 章 ， 现 在 可 以 利用 方差 分 析 进 行 分 析 ， 分 析 学 历 是 否 对 啤酒 综合 印象 
分 数 有 显著 性 的 影响 。 分 析 的 过 程 如 下 。 
第 一 步 : 提出 原 假设 和 备 择 假设 。 
Ho : 44 =, =, = M, 
H, :AAA 不 全 相等 
其 中 ， 为 高 中 及 以 下 总 体 的 啤酒 综合 印象 平均 分 数 ， 为 大 专 总 体 的 啤酒 综合 印象 平均 
分 数 ; AM 为 本 科 总 体 的 啤酒 综合 印象 平均 分 数 ; /Au 为 研究 生 及 以 上 总 体 的 啤酒 综合 印象 了 
均 分 数 。 
第 二 步 : 构造 检验 的 统计 量 ， 并 计算 其 值 。 
根据 前 面 的 介绍 ， 已 知 检验 的 统计 量 为 检验， 计算 下 的 值 软件 操作 过 程 如 下 。 
(1) 打开 “学 历 对 啤酒 印象 分 数 的 影响 分 析 ” 工 作 表 ， 单 击 “ 数 据 ” 一 “分 析 ” 一 “ 数 
据 分 析 ” 按 钮 ， 弹 出 “数据 分 析 ” 对 话 框 ， 如 图 7.2 所 示 。 
(2) 在 “数据 分 析 ” 对 话 框 中 的 “分 析 工 具 ” 列 表 中 选择 “方差 分 析 : 单 因 素 方差 分 
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析 ” 选 项 ， 单 击 “确定 ”按钮 ， 弹 出 “方差 分 析 : 单 因素 方差 分 析 ” 对 话 框 ， 在 “输入 区 
域 ”文本 框 中 输入 “$AS$40: $D$56”， 选 择 “ 标 志 位 于 第 一 行 ” 复 选 框 ， 选 中 “输出 区 域 ” 


















































单 选 按钮 ， 并 在 其 文本 框 中 输入 “$F$65”， 如 图 7.3 所 示 。 
方差 分 析 : 单 因素 方差 分 析 P?) 
r AS 
| = _ E > 
回 标 志 位 于 第 一 行 LL) 
E ia ; ER | 
PUN sien 
iy 加 生出 区 域 四 ) = S _ [sJ 
了 -检验 NPESE 人 〇 新 工作 表 组 下 ) 
e r Osrtwe Ay 
图 7.2 “数据 分 析 ” 对 话 框 图 7.3 “HED: 单 因素 方差 分 析 " 对 话 框 


G) 单 击 “ 确 定 ”按钮 ， 输 出 如 图 TA 所 示 的 统计 引荐 

根据 图 7.4 的 分 析 结果 ， 可 得 到 检 ; 验 的 统计 量 公 的 值 为 1387 22 。 

第 三 步 : 确定 拒绝 原 假设 的 区 域 ， 或 计算 P 慎 > 

根据 图 7.4 的 结果 可 知 ， 拒 绝 原 假设 的 区 域 为 (2.975154,+oo) ， 或 P=0.268 845 。 





44 7. 3333338 uW 66667 ` 
89 5.5625 W 15. 4625 
GGT 14. 166667 


了 P-value F crit 
3 ' 21.5875 1.38722 0.26884531 2.975154| 
404. 60417 26 15. 561699 








469. 36667 29 


图 7.4 统计 结果 








第 四 步 : 统计 决策 。 

以 传统 的 假设 检验 方法 决策 。 有 所 =1.38722 二 2.975154 ， 所 以 不 拒绝 原 假 设 ， 即 学 
历 对 啤酒 综合 印象 分 数 没有 显著 性 的 影响 

如 果 使 用 PP 值 进行 决策 ，P=0.268 845 > 0.1 ， 所 以 不 拒绝 原 假 设 ， 得 到 相同 的 结论 


























习题 
一 、 单 项 选择 题 


1. 与 假设 检验 方法 相 比 ， 方 差分 析 方法 可 以 使 犯 第 I 类 错误 的 概率 (  ). 
A. 提高 B. 降低 C. 等 于 0 D. 等 于 1 


BW 


PER ans f 章 
2. 方差 分 析 是 检验 ( )。 
A、 多 个 总 体 方差 是 否 相等 的 统计 方法 
B。 多 个 总 体 均值 是 否 相等 的 统计 方法 
C. 多 个 样本 方差 是 否 相等 的 统计 方法 
D。 多 个 样本 均值 是 否 相等 的 统计 方法 


3. 在 方差 分 析 中 ， 所 提出 的 原 假设 是 H: p= 1, =…= J ， 备 择 假 设 是 ( )- 
A. H,: 44hrs py 全 不 相等 B. H,: 2, > > phy 
C. H,: <, << phy D. H,: 4,4 py, 不 全 相等 

4. 在 方差 分 析 中 ， 进 行 多 重 比较 的 前 提 是 ( — )- 
A. 拒绝 原 假 设 
B. 不 拒绝 原 假 设 入 
C. 可 以 拒绝 原 假设 也 可 以 不 拒绝 原 假设 ë 天 K 
D. 各 样本 均值 相等 x 

5. 在 方差 分 析 中 ， 当 结论 为 拒绝 原 假设 时 ， 则 意味 着 ( < 


y 
A. 分 类 自 变量 对 数值 因 变 量 有 显著 性 的 影响 ` 
B. ny 





cC. 多 个 总 体 均值 中 至 少 有 一 对 均值 不 等 ， 
D， 多 个 总 体 均值 之 间 全 不 相等 / K 








6. HAD PRE e) 
A. 标准 正 态 B. í N XN. F D Z 
7、 在 方差 分 析 中 ， 检 验 统 训 量 是 C 让 Ps 
_SSA/k-1 -了 B. F = SAE UX 
2 2 i Fe 
SSE/ nak y VA SS 
c. p- SSAlk U p. FASSAM% 
SSTW -1 | , S OSST7n-k 
8. 在 方差 个人 F 
A.N(K (k-l,n-k), +0) BMF a (k-1,n- k), +0) 
c OP kLn-A) D. (—,F.,(k-1.n- k) 
9. 在 方差 分 析 中 ， 组 间 平 方 和 、 组 内 平方 和 、 总 平方 和 的 自由 度 分 别 为 ( )。 
A. k-l,n-k,n-1 B. k-l,n-l,n-k 
C. n-lk-l,n—k D. n-l,n-k,k-1 
10. 在 方差 分 析 中 ， 涉 及 一 个 分 类 的 自 变 量 ， 称 为 ( )- 
A. 单 因素 方差 分 析 B. 双 因素 方差 分 析 
C. 可 重复 双 因 素 方差 分 析 D. 不 可 重复 的 双 因 素 方差 分 析 








1. 最 小 显著 差异 方法 是 寻找 哪些 总 体 均值 不 等 的 方法 ， 其 原 假设 和 备 择 假设 为 ( “)。 
A. H; =u: H:in nG) B. Hyi, Su: H:n >u iZ j) 
C. H. >y: Mim <j) D. Hy: >u: H: S< ali j) 
2. 最 小 显著 差异 方法 的 检验 统计 量 是 (  ) 分 布 。 
A. 标准 正 态 B. t 
D.F D; g 





Anag 


T: TU ww 


13. 最 小 显著 差异 值 的 计算 公式 是 ( )- 


D. LSD=¿,,(k-D us) 
n n, 


14. 在 方差 分 析 中 ， 总 平方 和 (SST)、 组 间 平 方 和 (SSA)、 组 内 平方 和 (SS 于 的 关系 为 ( ). 


A. SST=SSA+SSE B. SSA=SST+SSE 
C. SSE=SST+SSA D. SST=SSA-SSE 
15， 在 方差 分 析 中 ， 衡 量 分 类 自 变 量 对 数值 因 变量 的 影响 程度 指标 是 ( — )- 
Ae FÈ B. SST C. SSA D. SSE 
二 、 简 答题 


1， 简 述 方差 分 析 的 思路 。 

2， 简 述 方差 分 析 的 几 个 基本 的 假定 。 
3， 简 述 方差 分 析 的 步骤 。 

4， 简 述 最 小 差异 方法 的 步骤 。 





三 、 计 算 题 


1， 某 家 企业 采用 自动 生产 线 饶 装 饮料 ， 要 求 每 饶 的 容量 为 255mL， 现 有 4 种 自动 生产 线 ， 为 了 检验 
每 种 生产 线 是 否 有 显著 的 差异 ， 随 机 从 各 生产 线 捕 到 二 组 样本 ， 数 据 见 表 7-6 所 示 。 





表 7-6 生产 线 数据 


























EERI 生产 线 4 
256 249 
260 248 
245 251 
241 256 
251 257 
253 258 
= 249 
= 248 











取 显 著 性 水 平 a = 0.01 ， 检 验 4 个 生产 线 的 装填 量 是 否 有 显著 性 差异 。 
2. 城市 道路 交通 管理 部 门 为 了 研究 不 同 的 路 段 对 行车 是 否 有 影响 ， 让 一 名 交通 警察 分 别 在 3 个 路 段 
亲自 驾车 进行 实验 ， 通 过 实验 共 获 得 15 个 行车 时 间 的 数据 ， 见 表 7-7 所 示 


EETA 


表 7-7 行车 时 间 数 据 























3. 城市 道 
间 段 亲自 驾车 进行 3 
分 析 得 到 表 7-8 所 示 的 广 






理 部 门 为 了 研究 不 同 的 时 间 段 对 行车 是 否 有 影响 。 社 一 名 交通 警察 分 别 在 3 个 时 
通过 实验 共 获得 30 个 行车 时 间 的 数据 ， 通 过 对 每 个 时 间 段 的 行车 时 间 进 行 方差 








表 7-8 方差 分 析 表 





(1) 完成 上 面 的 方差 
(2) 若 显著 性 水 平 ws 005 一 检验 3 个 时 间 段 的 行车 时 间 是 否 有 显著 性 的 差异 。 


四 、Excel 操作 题 
1. #JH) Excel 操作 ， 检 验 第 三 题 的 第 一 题 的 水 个 生产 线 的 装填 量 是否 有 显著 性 差异 ， 并 进行 方差 


分 析 。 
2. PH Excel 操作 ,检验 第 三 题 的 第 二 题 的 3 个 路 段 对 行车 时 间 否 有 显著 性 影响 ， 并 进行 方差 分 析 。 
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第 Ñ = 相关 与 一 元 回归 分 析 





1， 掌 握 变量 相关 关系 分 析 。 KR 
2 党 提 一 元 加 由 分 析 ， 包 括 末 人 计 的 广 法 (小生 这 、 线 导 关系 检验 、 加 用 和 
的 检验 。 


3， 掌 握 一 元 回归 预测 。 x 
4 掌握 多 元 回归 分 析 。 S N 
5。 掌 握 回 归 分 析 的 软件 操作 ， /下 


NAERAA SEAR WX BREER NARI MRNA. M 
FAEERE DATT, IRE AER EAER GR RTA S fatal 
Wis RTRA D) L AE 5022 BJ002 8, WIEKIEM. MERZ 
4 关系 形态 上 看 ， 有 线性 相关 与 线性 回归 分 析 直 非 线 仁 相 关 与 非 线性 回归 分 析 。 其 中 多 元 
EAE 人 4_ 节 介绍 ， 重 点 介绍 二 元 线性 向 由 分 析 ， 因 为 多 元 线性 回归 分 析 原 理 同 
一 元 线性 回归 相间 K< 

木 章 全 对 目的 是 利用 相关 与 回归 分 析 进 行经 济 预 测 和 经 济 控制 。 要 达到 此 目的 ， 需 分 
3 步 进行 。 

第 一 步 。 进 行 相关 分 析 。 目 的 是 判断 因 变 量 和 自 变量 之 问 是 否 具有 线性 关系 。 

注意 : 这 里 把 关系 定 为 线性 关系 ， 因 为 非 线性 的 关系 ， 可 以 通过 转换 为 线性 关系 。 

第 二 步 ， 回 归 分 析 。 如 果 第 一 步 判断 出 变量 之 间 存 在 线性 关系 ， 则 要 进行 变量 的 回归 
分 析 。 

第 三 步 ， 经 济 预 测 和 经 济 控制 。 这 一 步 主要 是 利用 第 二 步 的 回归 分 析 ， 进 行经 济 预测 
和 经 济 控制 。 

其 中 第 一 步 是 8.1 节 的 内 容 ， 第 二 步 是 82 节 的 内 容 ， 第 三 步 是 83 节 的 内 容 。 
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8.1 相关 分 析 的 基本 理论 


8.1.1 ”变量 间 的 关系 


在 生产 和 经 营 活动 中 ， 经 常 要 对 变量 之 间 的 关系 进行 分 析 。 例 如 ， 在 企业 生产 中 ， 要 
对 影响 生产 成 本 的 各 种 因素 进行 分 析 ， 以 达到 控制 成 本 的 目的 ， 在 商业 活动 中 ， 需 要 分 析 
广告 费 支出 与 销售 量 之 间 的 关系 ， 进 而 通过 广告 费 支出 来 预测 销售 量 等 。 统 计 分 析 的 目的 
EF, 根据 统计 数据 确定 变量 之 间 的 关系 形态 及 其 关联 程度 , 探索 出 其 内 在 的 数量 规律 性 。 
人 们 在 实践 中 发 现 ， 变 量 之 间 的 关系 形态 可 分 为 两 种 类 型 ， 即 函数 关系 和 相关 关系 。 
其 中 函数 关系 是 人 们 比较 熟悉 的 。 设 有 两 个 变量 x 和 y, 变量 y 随 Maert 并 完全 
依赖 于 x， 当 变量 x 取 某 个 值 时 ，? 依 确定 的 关系 取 相 应 的 i 
y= f(x)。 其 中 , x 称 为 自 变量 ，y 称 为 因 变量 。 AT 对 应 的 确实 关系 ， 但 在 实 
际 问题 中 ， 变 量 之 间 的 关系 往往 不 是 那么 简单 。 / 

te 它们 之 间 就 不 存在 完全 确定 的 关系 。 
也 就 是 说 ， 收 入 水 平 相同 的 家 庭 ， 其 储蓄 额 往往 不 同 ， 反之， 储蓄 额 相同 的 家 庭 ， 其 收入 
op s s Q À ES r ae 
与 家 庭 储蓄 有 密切 的 关系 ， 但 它 辣 储 蓄 的 唯一 因素 ， 还 有 银行 利率 、 消 费 水 平等 
其 他 因素 的 影响 作用 。 ERT Aana C ia i 
不 确定 性 。 



























































` 
定义 8.1 变量 A AA 


812 XAMA x N 


On 两 个 变量 的 总 体 
数据 是 不 易 得 到 的 ， 这 时 通常 使 用 推断 统计 ， 利 用 两 个 变量 的 样本 推导 总 体 的 关系 ， 即 相 
关 分 析 要 解决 的 问题 包括 : 两 变量 的 样本 之 间 是 否 存在 线性 的 关系 ，@@ 两 变量 的 样本 之 
间 的 关系 强度 如 何 ，@ 样 本 所 反映 的 变量 之 间 的 关系 能 否 代 表 总 体 变量 之 间 的 关系 。 

为 解决 这 些 问题 ， 在 进行 相关 分 析 时 ， 应 对 总 体 做 一 个 基本 假定 ， 即 两 个 变量 都 是 随 
机 变量 。 

下 面 按照 以 上 的 相关 分 析 的 问题 一 一 展开 讲解 。 

1. KAA 

通常 使 用 散 点 图 来 判断 两 变量 的 样本 之 间 是 否 存在 线性 关系 。 

定义 8.2 ”对 于 两 个 变量 x 和 y， 通 过 观察 或 试验 可 以 得 到 若干 组 数据 ， 记 为 (x,y,)， 
i=1,2,…,n。 如 果 用 坐标 的 水 平 轴 代 表 自 变量 x, 用 纵 轴 代表 因 变 量 y, 那么 每 组 数据 (x,y,) 
E 标 系 中 就 可 用 一 个 点 表示 ，n 组 数据 在 坐标 系 中 形成 的 n 个 点 称 为 散 点 ， 由 坐标 及 其 
散 点 形成 的 二 维 数据 图 称 为 散 点 图 。 

不 同形 态 的 散 点 图 如 图 8.1 所 示 。 
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(a) 正 线性 相关 (b) 负 线 性 相关 
y 

10 10 
9 9 
8 8 
7 7 
6 6 
5 y 5 
4 aa 4 
3 3 
2 X 
1 SPF 
0 0 

0 5 10 N 








(c) 完全 正 线性 相关 














ey 
































(e) 非 线性 相关 (f) 不 相关 


图 8.1 不 同形 态 的 散 点 图 


从 图 8.1 中 可 以 看 出 ，(a) 和 (ce) 呈现 出 两 个 变量 正 相关 ，(b) 和 (d) 呈 现 出 两 个 变量 是 负 相 
关 ，(e) 是 呈现 出 非 线性 相关 ，(9 不 相关 。 

如 果 两 个 变量 的 样本 数据 表现 出 是 上 面 的 (a)、(b)、(c) 和 (d) 任 意 一 种 ， 则 两 变量 的 样本 
之 间 存 在 线性 关系 。 

【 例 8.1】 为 了 研究 所 得 产量 与 生产 费用 支出 之 间 的 关系 , 某 汽车 商 管理 部 门 随机 抽取 
了 12 家 汽车 生产 企业 ， 得 到 它们 的 产量 与 生产 费用 支出 的 数据 ， 见 表 8-1 所 示 。 绘 制 产量 
与 生产 费用 的 散 点 图 ， 判 断 二 者 之 间 的 关系 形态 。 
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表 8-1 12 家 汽车 生产 企业 的 产量 与 生产 费用 数据 


生产 费用 /万 元 生产 费用 /万 元 







































1 | 40 130 165 
5 | 42 150 170 
3 | 50 155 116 167 
4 | 140 180 
5 | 150 175 
6 154 185 








解 : 产量 与 生产 费用 的 散 点 图 如 图 8.2 所 示 。 











生产 费用 /万 元 
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82 产量 与 生产 费用 的 散 点 图 

从 图 8.2 中 可 以 荐 由 7 随 着 产量 不 断 地 增加 < 生字 费用 也 越 大 ， 二 者 的 数据 点 分 布 在 
一 条 直线 的 附近 7 因此 二 者 之 间 具 有 线性 相关 关系 。 

注意 闪 叱 时 的 二 者 具有 的 线性 相关 关 乔 是 指 二 者 的 样本 ， 并 不 是 指 总 体 。 

2， 相 关系 数 

通过 散 点 图 可 以 判断 两 个 变量 之 间 有 无 相关 关系 ， 只 能 对 变量 间 的 关系 形态 做 出 大 致 
的 描述 ， 要 想 知道 两 个 变量 的 关系 强度 ， 需 要 计算 相关 系数 。 

《概率 与 数理 统计 》 已 经 介绍 过 ， 如 果 是 计算 总 体 的 相关 系数 ， 记 为 p ; 如 果 计 算 样本 
相关 系数 ， 记 为 y 。 在 上 面 已 经 介绍 过 ， 总 体 的 数据 是 不 易 得 到 的 ， 通 常 只 能 得 到 样本 的 
数据 ， 所 以 这 里 所 说 的 相关 系数 是 指 样本 的 。 样 本 的 相关 系数 又 称 皮尔 逊 相 关系 数 ， 则 样 
本 相关 系数 的 计算 公式 为 

2 -90:=) 


Hl 























y= 


Èl- o) 
为 了 根据 原始 数据 计算 > ， 可 以 推导 出 的 简化 计算 公式 为 
o 22, ray 





ANCE 


统计 学 ( ) 理论 5 实务 — í í í 


样本 相关 系数 y 具有 以 下 特点 。 

(1) y 的 取 值 范 围 为 -1 三 y 志 1， 如 果 0=y 三 1， 则 表明 两 个 变量 存在 正 线性 相关 关 
R: 如 果 --1 硅 y=0， 则 表明 两 变量 存在 负 线 性 相关 关系 ; 如 果 y =0 时 ,说 明 两 个 变量 之 
间 不 存在 线性 相关 关系 。 

(2) y 具有 对 称 性 。y 的 具有 对 称 性 是 指 x 与 y 之 间 的 相关 系数 y, 和 ?了 与 x 之 间 的 相 
关系 数 ] 相等 ， 即 jw =, 。 

(3) y 的 大 小 与 x 和 yy 的 原点 及 尺度 无 关 。 例如 ,研究 儿童 身高 与 年 龄 的 关系 分 析 ， 无 
论 身高 采用 m 还 是 cm 作 单位 ， 都 不 会 改变 身高 和 年 龄 的 相关 系数 数值 。 

(4) > 仅仅 是 x 与 ?之 间 线 性 关系 的 一 个 度量 ， 它 不 能 用 于 描述 非 线性 关系 。 样 本 的 相 
关系 数 这 一 点 决定 了 ， 在 进行 相关 分 析 ， or 如 果 存 在 
线性 关系 ， 才 能 计算 关系 强度 ， 否 则 ， 不 可 以 计算 相关 系数 

(5) > 虽然 是 两 个 变量 之 间 线 性 关系 的 一 个 度量 , 却 不 - 着 x 与 y 一定 存在 因果 
【 例 8.2】 沿用 例 8.1 中 的 数据 ， ag J 线性 关系 强度 。 
解 :样本 相关 系数 的 公式 为 ` 
























































Aya 1640854 
gy 08 x V310 505 uN 1 


"60 08.583 


< 14 282.92 x Pam = 
6 008.583 08.583 _ 
119.5112x54.63489 7 Yo = 0220252 
nn 与 生产 费用 的 关系 强度 为 0.920 232， 具 有 较 强 的 正 线性 
相关 关系 。/ 
可 以 利用 Excel 中 的 相关 系数 函数 计算 相关 系数 ， 操 作 过 程 如 下 。 
进入 Excel 界面 ， 单 击 “ 插 入 函数 ”按钮 ， 弹 出 “插入 函数 ”对 话 框 。 单 击 “ 或 选择 
类 别 ” 的 下 拉 按钮 ， 在 弹出 的 下 拉 列 表 中 选择 “统计 ”选项 ， 并 在 “选择 函数 ”列表 中 
选择 CDRREL 选项 ， 然 后 单 击 “ 确 定 ”按钮 ， 弹 出 “函数 参数 ”对 话 框 。 在 对 话 框 中 输入 
两 组 要 计算 的 数据 区 域 ， 单 击 “ 确 定 ”按钮 ， 返 回 结果 相关 系数 为 0.920 232 426 ， 如 图 8.3 
所 示 。 
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Arrayt [B203 EEE]= t40:42:50:55;65;7 
Arraye [C2013 SJ: {130;150;155:140 





8.3 “函数 参数 ”对 话 框 
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3 相关 关系 的 显著 性 检验 

从 上 面 的 散 点 图 和 相关 系数 的 计算 ， 得 到 两 变量 的 样本 具有 较 强 的 正 线性 相关 关系 ， 
如 果 想 知道 两 变量 的 总 体 是 否 具 有 较 强 的 正 线性 相关 关系 ， 采 用 了 推断 统计 ， 来 检验 样本 
所 反映 的 变量 之 间 的 关系 能 否 代表 总 体 变量 之 间 的 关系 。 如 何 去 检 验 ? 这 里 使 用 的 方法 是 
相关 关系 的 显著 性 检验 。 既 然 是 检验 ， 那 么 应 满足 假设 检验 的 4 个 步骤 。 

(1) 提出 原 假设 和 备 择 假设 。 

研究 人 员 和 希望 是 两 个 变量 存在 较 强 的 线性 相关 关系 ， 而 且 前 面 已 介绍 过 ， 总 体 相关 系 







































































数 用 p 表 示 ， 即 研究 人 员 希 望 p #0 。 
H,:p=0, Hi:p#0 
(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 ° 
308 BEEE MIEREA E BIM y et ARDURE r yili, 
该 检验 可 以 用 于 小 样本 ， 也 可 以 用 于 大 样本 。 <S 
:=| 2 \ (8.1) 
Lap < N 


O REALKE a. MERER. 
(0, -tan (n -D oC Ce) +0) 
通过 查 ! 分 布 表 ， 可 查 出 上 (nz-2) 的 Ty 
(4) BWS ts(n 一 2)， 则 拒 RNA 委 明 总 体 的 两 个 变量 之 问 存在 显著 的 线性 关系 。 
车 四 < 坟 (n 一 2)， 则 不 拒绝 原 假 流 , 入 明 总 体 的 两 个 变量 之 间 不 存在 显著 的 线性 关系 。 
【 例 8.3】 沿用 例 8.1 证 的 数据 检验 产 量 与 生产 并 *) 之 间 的 相关 关系 是 否 显著 。 


(显著 性 水 平 z = 0.05 x< s 


解 : 
C) 提出 原 假设 和 备 择 假设 。 A 


NP: H,:p=0, Hi:p#0 
O) 全 各 验 的 统计 量 ， 并 计算 其 值 。 


-2 
t=|| jia- 


2-2 
=|p:920 232| 1—0.920 232° 


= 0.920 232 x V65.285 96 
= 0.920 232 x 8.079 973 = 7.435 453 
(3) 根据 给 出 的 显著 性 水 平 a =0.05 ， 确 定 拒绝 原 假设 的 区 域 。 
(—,—t, aos (10)) U (t, >; (10), +20) 
通过 查分 布 表 ， 可 查 出 mws(10) = 2.633 767 的 临界 值 。 
(4) 因为 川 =7.435 453 > wos(10) = 2.633 767 ， 所 以 拒绝 原 假设 ， 表 明 样 本 所 反映 的 变 
量 之 间 的 关系 能 否 代表 总 体 变量 之 间 的 关系 ， 即 产量 与 生产 费用 两 个 变量 存在 线性 关系 。 
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8.2 一 元 线性 回归 分 析 





8.2.1 回归 分 析 的 含义 


既然 由 相关 分 析 得 出 两 个 变量 之 间 存在 线性 关系 ， 那 么 下 面 就 要 考察 变量 之 间 的 数量 
伴随 关系 ， 并 通过 一 定 的 数学 表达 式 将 这 种 关系 描述 出 来 ， 即 回归 分 析 。 

这 里 要 强调 一 下 ， 要 对 两 个 变量 的 总 体 进行 回归 分 析 ， 而 两 个 变量 的 总 体 数据 是 不 易 
收集 的 ， 同 样 采用 推断 统计 ， 利 用 样本 数据 推出 总 体 的 回归 模型 。 具 体 来 说 ， 回 归 分 析 主 
要 解决 以 下 几 个 方面 的 问题 。 

(1) 从 一 组 样本 数据 出 发 ， et mA 

(2) 对 样本 回归 模型 进行 评价 。 

O) 检验 样本 的 回 肯 模型 是 下 能 代表 总 体 的 回归 模型 ww 
计 检 验 。 


8.2.2 ”一 元 线性 回归 模型 XK 
1. 总 体 回归 模型 RS 


定义 83 在 回归 分 析 中 ， en a nas: 

定义 8.4 在 回归 分 析 中 ， POTIAS A 多 个 变量 , 称 为 自 变量 , 用 
表示。 多 

例如 ， ea 桥 中 ， 产 量 是 自 变量 ， 用 来 解释 生 
产 费用 ， 所 以 产量 为 总 -生产 费用 为 y。 
rra viy 析 中 ， 用 来 测 量 间 自 变量 外 因素 对 因 变 量 的 影响 ， 称 为 误差 项 ， 

Ë o 

定义 名 s uu S Seks Suspgs 

只 涉及 一 个 自 变量 的 一 元 线性 回归 模型 可 表示 为 

y=A +Ax+ £ (8.2) 

在 上 述 一 元 线性 回归 模型 中 ，y 是 x 的 线性 函数 加 上 误差 项 6 。 其 中 羽 、 忆 称 为 模型 的 
参数 。 

对 于 一 元 回归 模型 ， 有 以 下 几 个 基本 的 假定 。 
(1) 误差 项 6 服从 正 态 分 布 ， 即 5~N(0,07) ， 数 学 期 望 值 为 0， 方 差 为 o?。 其 中 数学 
望 值 为 0， 是 采用 最 小 二 乘法 可 以 保证 的 ， 如 果 方 差 不 为 oc?， 即 不 是 定 值 时 ， 在 计量 经 
济 学 中 称 之 为 异 方差 ， 要 用 相应 的 修正 方法 来 使 之 满足 。 
(2) 误差 项 < 与 解释 变量 x 无 关 ， 即 cov(x,é&)=0。 上 面 介绍 过 ， 除 了 产量 影响 生产 费 
用 之 外 ， 还 有 其 他 的 因素 ， 只 是 产量 占 主 要 的 因素 ， 这 时 要 求 误差 项 上 与 解释 变量 x 无 关 
否则 会 出 现 多 重 共 线 性 。 
G) 在 重复 抽样 中 ， 解 释 变量 x 是 固定 的 ， 即 假定 x 是 非 随机 的 。 
根据 回归 模型 中 的 假定 ，& 的 期 望 等 于 0, 因此 y 的 期 望 值 EO) = A, + Bx 。 也 就 是 说 ， 
>》 的 期 望 值 是 x 的 线性 函数 。 
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定义 8.7 ”描述 因 变 量 y 的 期 望 值 如 何 依赖 于 自 变量 x 的 方程 ， 称 为 回归 方程 。 





一 元 线性 回归 方程 的 形式 为 

















EY) =p, + x (8.3) 


式 中 ， 及 为 回归 直线 在 > 轴 上 的 截 距 ， 是 x=0 时 y 的 期 望 值 ， 忆 为 直线 的 斜率 ， 它 表示 





当 x 每 变动 一 个 单位 时 ，y 平均 变 动 值 。 




















如 果 回 归 方 程 中 的 参数 、p 已 知 ， 那 对 于 一 个 给 定 的 x 值 ， 利 用 E(y)= A, + Ax 
能 计算 出 y 的 期 望 值 。 但 由 于 总 体 回归 参数 BP A 是 未 知 的 ， 因 此 必须 利用 样本 数据 去 估 



























































计 它 们 。 


2. 样本 回归 方程 


方程 。 


定义 8.8 ”根据 样本 数据 求 出 的 回归 方程 的 估计 ， ws 又 称 估计 的 回归 




















则 一 元 线性 回归 、 样 本 的 回归 方程 可 表示 为 SSS 
=Â, + Âx 9- (8.4) 
RP, Å JER EIRE: nate As 斜率 。 表 示 为 给 定 解释 变量 x 值 ， 
得 到 被 解释 变量 的 估计 值 。 


823 ”参数 的 最 小 二 乘 估计 





要 根据 给 出 


XA 
< 


knihy) wam, a s 乘法 。 


首先 介绍 一 下 什么 是 最 水 王 烹 滨 ， 
在 初中 几何 作 图 中 ,我 们 学 过 如 何 根据 若干 个 乱 3 Loa 以 例 8.1 的 数据 为 例 


ep 之 条 直线 的 ， 即 做 线 的 诛 则 是 什么 。 
emen TEE LAGS, AIMH. 
:/ 根据 


一 步 : 36 


线 的 原则 ， 画 出 一 条 直线 ; 














$ sN 直线 求 出 来 ， 即 求 样 术 EINE $, = Â, + Bx WE 8.4 所 示 。 


生产 费用 /万 元 


4 生产 费用 /万 元 











0 50 100 150 

















图 8.4 ”样本 回归 方程 示意 图 











这 里 所 说 的 最 小 二 乘法 就 是 根据 这 个 做 线 的 原则 得 出 的 。 





做 线 的 原则 : 





让 尽 可 能 多 的 点 落 在 直线 上 ;如 果 落 不 到 直线 上 的 点 ， 让 其 尽 可 能 地 在 
NE 


统计 学 (O) 理论 5 实务 — í í í í 


直线 上 下 近 距 离 的 波动 。 

让 尽 可 能 多 的 点 落 在 直线 上 ， 落 在 直线 上 的 点 到 直线 的 距离 就 是 0， 是 希望 这 样 的 点 
越 多 越 好 ， 不 能 落 在 直线 上 的 点 ， 让 其 在 直线 近 距 离 地 波动 ， 也 是 希望 点 到 直线 的 距离 越 
小 越 好 ， 也 就 是 说 ， 它 希望 得 到 的 这 条 直线 是 让 所 有 点 到 直线 的 距离 和 最 小 。 这 时 出 现 一 
个 关键 词 “ 最 小 ”。 

问题 又 出 现 ， 点 到 直线 的 距离 和 最 小 ， 那 这 里 所 说 的 距离 是 哪个 距离 ? 一 个 点 到 直线 
的 距离 有 3 种 : 竖 直 距离 、 垂 直 距 离 和 水 平 距离 ， 如 图 8.5 所 示 。 

















图 8.5 Ee wa 


于 在 一 元 回归 模型 假定 x f; 六 此 取 的 是 坚 直 距离。 
由 上 面 的 分 析 可 知 ， spia ent 





















































示 y 一 为， 如 果 点 在 直线 上 面 ; ， as H 线 下 面 ， 此 坚 直 距 离 为 负 
要 求 的 是 距离 和 最 小 ， 而 竖 直 距离 有 正 有 负 ， 条 必修 ， 因 此 把 每 一 个 点 的 坚 直 
离 进行 平方 再 求 和 最 即 求 每 个 点 到 直 aya e 方 和 最 小 ， 这 里 最 后 出 现 了 两 个 关 
键 词 “平方 人 必 报 小 ”， 合 起 来 就 是 最 小 平 而 法 人 妈 最 小 二 乘法 。 


定义 89 使 因 变量 的 观察 值 y SSK: 之 间 的 离 差 平方 和 达到 最 小 来 求 得 房 和 房 
的 方法 ， 称 为 最 小 二 乘法 ， 也 称 最 小 平方 法 。 
最 小 二 乘法 求解 参数 估计 值 的 步骤 如 下 。 
(D 根据 最 小 二 乘法 的 定义 可 得 
L=5 0-8? = Zo, -Ê -2x7 
Q) 求 minL ， 一 般 情 况 ， 分 别 对 上 式 中 的 未 知 数 求 一 阶 偏 导 ， 令 其 式 子 为 0。 





ôL 
a Ê, -Êx,)=0 © 
rE -2x (y, - Ê,- Êx,)x, = © 


G) ROREM: 
Ev -nô, -2x =0 
两 边 同时 除 以 4， 可 以 得 到 


EW 


i GA & = 





相关 与 一 元 回归 分 析 ,at 仿 ,全 
式 @ 整 理 : 
六 -Êx -Â$ x; =0 

将 房 = y-Ax mx = 哑 代 入 上 式 中 ， 整 理 得 

xy, -5- x — = 

Èy ny 力 一 
Añ = ys — 

即 有 

-入 -号 O 2 À = Y (x, —x)(y, — y) 

”下 学 =n% >, — x) 

局 = 了 -Bx 入 (8.5) 
































【 例 8.4】 沿用 例 8.1 中 的 数据 ， CA 


解 ， 最 小 二 乘法 的 公式 为 SN 
AD 、 ZON 
DATA X = n `S 


_ 170094- 12x85.42x 160.08 
101835 12585, 422 

Š sS ~ 

Pis 92 2 


ÈZ 和 x =160.08- 042 X85342 12420 

即 样本 回归 方程 为 154263042x 。 Ww - 

从 最 小 二 -乘法 的 结果 可 以 得 出 - -个 重要 的 性 质 ， 即 (x,7) 在 样本 回归 方程 上 

,= 局 + Àx; AIA À, = 了 -I， 整 理 即 为 P= 所 + Àx 

oe utriHiyBWirhi TERR 85 节 案 全 中 会 详细 介绍 。 
824 ”样本 回归 方程 的 评价 

前 面 介绍 了 最 小 二 乘法 是 使 因 变 量 的 观察 值 y, 与 估计 值 之 间 的 离 差 平方 和 达到 最 小 
来 求 得 记 和 房 的 方法 ， 最 后 得 出 样本 回归 方程 名 = 房 + Ax, ， 下 面 要 对 样本 回归 方程 进行 
评价 。 这 里 所 说 的 评价 ， 就 是 对 直线 的 拟 合 程度 进行 评价 ， 可 以 想象 ， 如 果 各 观测 数据 的 
散 点 都 落 在 直线 上 ， 那 么 这 条 直线 就 是 对 数据 完全 的 拟 合 ， 同 时 代表 各 具 点 ，x 得 到 的 估 
计 值 与 真实 值 y 是 没有 误差 的 ， 即 各 离散 点 越 紧 密 围绕 直线 ， 这 条 直线 回归 得 越 好 ， 拟 合 
得 越 好 。 

定义 8.10 ”回归 直线 与 各 观察 点 的 接近 程度 ， 称 为 回归 直线 对 数据 的 拟 合 优 度 。 

评价 的 指标 有 很 多 ， 这 里 只 介绍 两 个 指标 。 

判定 系数 

判定 系数 是 对 样本 回归 方程 拟 合 程度 的 一 个 度量 ， 即 围绕 着 每 一 个 观察 点 ，x 得 到 的 

估计 值 与 真实 值 y 的 误差 大 小 进行 测量 。 
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最 小 二 乘法 估计 出 样本 回归 方程 后 ， 会 有 两 组 数据 ,分别 为 真实 值 y 和 了 》 了 ， 即 
Vo Ya y MA P Po ae 
HF yoyoy, 这 组 数据 ， 数 据 之 间 存在 差异 ， 差 异 大 小 用 差异 的 平方 和 表示 ， 称 这 
种 差异 的 大 小 为 总 平方 和 ， 记 为 SST。 总 平方 和 的 公式 为 
SST = $ (y, -7y (8.6) 
总 平方 和 是 反映 真实 值 的 离散 程度 。 而 总 平方 和 恰好 又 可 以 分 解 ， 如 图 8.6 
所 示 。 



























































Dbothiax, 











bS “y 
SN 总 平方 和 分 解 示意 图 ,六 
Y 
图 8.6 可 得 A XA 


XA 
SST= So -y7 E 




















o, - y) 
JOB ZO, -PIERD ,六 *, 广 这 组 数据 的 离 程度 。 因为 有 了 = 了 ,而 入 ,加 ,…, 训 是 
根据 样本 回 明 方程 得 出 的 ， 所 以 称 为 加 生平 记 和 ， 记 为 SSR: T O, -多 是 表示 各 实际 
观测 点 Sahi 线 的 残 差 y — p, WFO 1, 称 为 残 差 平方 和 ， 记 为 SSE。 即 有 
SST=SSR +SSE (8.7) 

从 图 8.6 可 以 直观 地 看 出 ， 样 本 回归 方程 拟 合 的 好 坏 取 决 于 SSR 和 SST 的 比例 ， 如 果 
全 部 点 落 在 直线 上 ， 此 时 SSE 为 0， 而 SSR 与 SST 是 相等 的 ， 也 就 是 说 样本 数据 100% 都 
落 在 直线 上 了 ,表示 直线 拟 合 越 好 ;如 果 全 部 点 都 没落 在 直线 上 ， 即 样本 观察 点 0% 落 在 直 
线 上 ， 表 示 直 线 拟 合 不 好 。 


定义 8.11 ”回归 平方 和 占 总 平方 和 的 比例 ， 称 为 判定 系数 ， 记 为 R? 。 
2 _ SSR _ SST-SSE SSE 

R =1 ->= (8.8) 
SST SST SST 
式 (8.8) 可 知 判定 系数 R 的 取 值 范围 为 [0,1] ， 当 R* =1 时 ， 代 表 所 有 样本 点 都 落 在 
归 直 线 上 ， 这 时 这 条 回归 直线 是 完全 拟 合 ; 当 R* =0 时 ,代表 没有 样本 点 落 在 回归 直线 上 
这 时 回归 直线 拟 合 的 是 最 差 的 。 所 以 R 越 接近 1， 回 归 直 线 的 拟 合 越 好 。 
【 例 8.5】 沿用 例 8.1 中 的 数据 ， 用 判定 系数 评价 例 8.4 得 到 的 产量 x 与 生产 费用 y 的 


样本 回归 方程 。 
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相关 与 一 元 回归 分 析 ,.aes 壹 .人 滞 

解 : 根据 数据 可 得 7=160 ， 所 以 有 

SST= (y, 7) 
=(130—160) +---+ (185—160)? 
=2985 

在 例 8.4 rh, C'e8481Fe KIA $, =124.20+0.42x, WEERA E x, RAE 
归 直 线 中 ， 可 得 出 广 的 数值 。 

SSE = 7,(»,—$) =457.211 
其 中 有 SST=SSR +SSE ， 则 SSR = 2527.79 ， 所 以 有 
pe -SSR _SST-SSE__j SSE 
SST SST SST 
即 有 84.68% 个 样本 点 落 在 直线 上 ， 说 明 直 线 拟 合 优 度 较 好 。 / 

从 判定 系数 的 分 析 过 程 可 以 得 知 SST= zo N SSE= Zo, -> 和 
SSR=)'($ -y), ， 同 时 在 进行 回归 分 析 时 ， 对 回归 几 条 基本 的 假定 ， 其 中 有 一 
条 是 误差 项 上 服从 正 态 分 布 ， 即 Z—N(0,o2) , me agere 分 布 ， 可 以 推 知 因 安 量 
yy 也 服从 正 态 分 布 ， 人 WA 最 后 可 以 推出 SST= ` (y, -7Y 
SSE=》 (y, -7 和 SSR=》( 人 -更 三 者 都 服从 和 妇 分 布 ， 且 自由 度 分 别 为 ml、 
Re 即 有 

T— Z (n-l) N 
sh a (A) AR 
rYA SSE—Z(n-k— 

2. wart | 

残 差 平方 和 SSE= y,- Aç 际 观 测 值 "与 样本 回归 方程 的 估计 值 多 之 间 的 
差异 程度 ， 以 用 来 度量 各 实际 观测 值 在 直线 周围 的 散布 状况 ， 这 个 量 就 是 估计 标准 
误差 。 H 

定义 8.12” 残 差 均 方 的 平方 根 ， 称 为 估计 量 的 标准 差 ， 或 称 为 标准 误差 ， 用 表示 。 

实质 上 ， 估 计 标 准 误差 是 对 误差 项 上 的 标准 差 e 的 估计 。 

估计 标准 误差 的 计算 公式 : 





=84.68% 














(8.9) 


s =VM E= = (8.10) 


估计 标准 误差 是 反映 实际 观测 值 y 与 样本 回归 方程 的 估计 值 六 之 间 的 差异 的 大 小 ， 当 
s, =0 时 ， 代 表 各 观测 点 全 部 都 落 在 回归 直线 上 ， 这 条 直线 拟 合 的 越 好 ， 所 以 说 s。 越 接近 0 
时 ， 样 本 回归 方程 拟 合 的 越 好 。 

【 例 8.6】 沿 用 例 8.1 中 的 数据 , 用 估计 标准 误差 评价 例 8.4 得 到 的 产量 x 与 生产 费用 y 
的 样本 回归 方程 。 

解 : 根据 题 意 有 
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其 中 SSE= > (y, -及 ) =457.21, n-2=10, MAA 


s, =VMSE = == =6.76 











8.2.5 ”一 元 线性 回归 方程 的 统计 检验 


从 前 面 的 介绍 中 ， 得 到 了 样本 的 回归 方程 ， 但 我 们 的 目的 不 是 要 样本 的 回归 方程 ， 而 
是 要 总 体 的 回归 方程 ， 这 时 利用 推断 统计 来 检验 样本 的 回归 方程 是 否 能 真实 地 反映 解释 变 
量 x 与 被 解释 变量 y 的 关系 。 
可 归 方 程 的 统计 检验 主要 包括 两 个 方面 的 内 容 ， 一 是 线性 关系 的 检验 ， 二 是 回归 系数 
的 检验 。 入 

1. 线性 关系 的 检验 K 

线性 关系 的 检验 主要 是 检验 解释 变量 x 与 被 解释 变量 < 线性 关系 是 否 显著 ， 即 
两 者 的 线性 模型 y= p+ Bx+ 是否 成 立 。 

(1) 提出 原 假设 H, MIFELE H, o < 

有 , :B=0 线性 关系 不 显著 N xS 

H:B 0 线性 关系 显著 a | i 

(2) 构造 检验 的 统计 量 ， 并 计算 

P 分 N ` SPS 
方 和 (SSE) 为 基础 。 

由 上 面 的 分 析 可 得 “2 


x SST 一 妇 ne s 










































































3 A SSR—Z (O). 
` SSE Sx:(n- F=) 


其 中 上 为 解释 变量 的 个 数 ， 在 一 元 线性 回归 方程 中 ， 解 释 变量 只 有 一 个 ， 即 =1。 所 以 检 
验 的 统计 量 为 
SSR /1 
ja CPE) F(l,n—2) (8.11) 


(3) 根据 给 出 的 显著 性 水 平 a ， 确 定 拒 绝 原 假设 的 区 域 。 
(, (1,n—2),+%0) 





(4) 统计 决策 。 

当下 > 已 (La -2) 时 ， 检 验 统计 量 落 在 拒绝 原 假 设 区 域内 ， 所 以 拒绝 原 假 设 ， 两 变量 
的 线性 关系 显著 。 

【 例 8.7】 沿 用 例 8.1 中 的 数据 ,检验 产量 x 与 生产 费用 y 的 线性 关系 是 否 显著 .(w = 0.05) 

解 : 


CD 提出 原 假设 H, 和 备 择 假设 所 。 
Hip =0 线性 关系 不 显著 
到 :#0 线性 关系 显著 


EW 


相关 与 一 元 回归 分 析 , 115 章 
(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 
s opia) 
SSE/(n—2) 
其 中 SSR =2527.79 SSE =457.21， 所 以 有 
_ 2 527.79/1 
~ 457.21/10 
G) w=0.05 ， 确 定 拒绝 原 假设 的 区 域 。 
(Kus(10),+oo) 
# F MRI F, (1.10) = 4.964 603 。 
(4) 统计 决策 。 - 
F =55.287 3 > F, (1,10) = 4.964 603 , 检 ain a “ç NË ， 所 以 拒绝 原 
假设 ， 两 变量 的 线性 关系 显著 。 I N 
2. 回归 系数 的 检验 ~ 
在 线性 模型 y= p+Bx+< 中 ， 回 归 系 数 有 所 A 











=55.2873 





行 检验 。 N 
1) 回归 系数 8 的 检验 XS 


(1) 提出 原 假设 万 mene 
0: H, WW 


O 构造 检验 的 统计 量 ， aS 
ete 其 样本 入 手 ， ugama -乘法 有 


2 A a-o; -DX 
> G= SN 
*< 
_ lG = x), (x, —2)y] 


x 一 部) 





x R 
i _ >G -Dy 
XG - xy 
-20D - y> (x -7) 
> (x, —- x) 


, _ 27 (x, —x)y, 
B EG — x) 
即 房 是 ”的 线性 组 合 ， 而 上 服从 正 态 分 布 , 有 -Na+ px), MAA À IRAE 
态 分 布 。 接 着 要 计算 其 数学 期 望 值 和 方差 ， 计 算 过 程 如 下 。 


Sas (x= 3) pi J HEL p 
$C, Yes # Ó =X Gy;。C, 具 有 以 下 性 质 。 


© >C=0。 


其 中 (x 一 x)=0， 所 以 有 





Ne 
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证 明 , Zo -< 人 





XO xy 
@ X'C(x,-x)=1, 
E: CG = yu G =s > 
>G - 
(x — x) 
FG- 
2a- | 
> G, - x) 
© cx =l. : K 
证 明 有 》 C(x -x)=1 
NI 
左边 = 了 (Cx -xC) =E Cx, -Dc =F.Cx, EX 
其 中 了 C=0， 所 以 有 Cx =1。 A 下 
; 1 YN- 
C? =s r.e PNY 
@ xc, YG P ,A 
(y x) 
证 明 : C= 
> De q S -F 
-过 > 
2 26 rx) xL ° 
X "XX 
D _ xy x X i 


有 了 _ CHR, Fir eE P A ASN A. 
N rdh) = E( Cy) =Z GEIE SC (a+ pr)- aC + BEC, 
其 中 > C=0，》Cx =1， 则 有 
E(A)= ñ, 
D( 户 )= DC Cyw)， 因 为 % 之 间 是 相互 独立 的 ， 所 以 有 
DÊ)= XCD) 




















其 中 D(y,)=o*， 则 有 





ó 2 二 1 E 
D(A)=o°X C, "YG 





即 有 


=N; e (8.12) 


ya 
有 了 这 个 分 布 ， E a 


oo 
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2- -Non 
YG - xy 
为 o 未 知 ， 而 前 面 已 介绍 估计 标准 误差 是 其 估计 值 ， 而 估计 标准 误差 是 残 差 均 方 ， 
所 以 有 
t= A-A ~t(n-2) (8.13) 
Ea- 
ERE H, : 8 =0 代 入 此 式 ， 有 
1= 人 ~in-2) , K (8.14) 
Sa r Ë 
À <N 





s= Ya 是 房 的 标准 误差 < 
i / 
O 根据 给 出 的 显著 性 水 平 < , 域 。 
此 检验 为 双 侧 检验 ， ee 
(一 ,一 (7 一 2),+oo) 
(4) 统计 决策 。 SS 
> D, ANA s". “oss 回归 系数 
P 回归 系数 房 的 4 检验 g AAL 
(1) s 和 备 择 假 设 H, o X 


9 mA #0 
D < oe 2 
EIA pareen N 即 房 。 根 据 最 小 二 乘法 有 


Á =y- ÊF sity t -+y,)- ÊX 





IHA = Cy, HAR 





ai " 
Ê = Ot tety) -F2 Cy 


=Z- 
同样 房 是 的 线性 组 合 ， 而 服从 正太 分布 ， 有 一 Nu + pxo), HH À, WH 
从 正 态 分 布 。 接 着 要 计算 其 数学 期 望 值 和 方差 ， 计 算 过 程 如 下 。 
E(B)= EC. - CEO) 











| aa 
=G -CNet+ Bx) 


NS 
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-aP 30)+ EO -Cx 
=a(l-7}, C)+ G -79 Cx) 
其 中 >.C=0，>Cxm=1， 有 
E(À)= A, 
p(À)=D(EC--sC)y)= PG. -xGp0) 





=P 5-30} 


=g" E-a, +x°C?) 入 
=o? :CC-25Zc +r >e ) KK 








FRES S. 用 估计 标准 误差 代替 ， 所 议 有 
p- Bh n- (8.15) 











mi 








中 把 原 假设 H, :B,=0 代 入 此 式 ， 有 


Á 


SA 


1= 饼 ~-2) (8.16) 





其 十 a 1 — > _ 2 是 B 的 标准 误差 。 
其 中 s; = (ss ， 是 羽 的 标准 误差 


G) 根据 给 出 的 显著 性 水 平 c ， 确 定 拒 绝 原 假设 的 区 域 。 
此 检验 为 双 侧 检验 ， 其 拒绝 原 假设 的 区 域 为 
(—,-t, I (n—2))UG(t,,(n—2),+e) 
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(4) 统计 决策 。 
当 川 >a(n 妨 时 ， 检 验 统计 量 落 在 扰 绝 原 假设 区 域内 ， 所 以 拒绝 原 仿 设 ， 
Aw, 

【 例 8.8】 沿用 例 8.1 中 的 数据 ， 检 验 回归 模型 的 回归 系数 是 耕 显著 (x= 005 

解 ， 首 先 检验 回归 系数 户 。 

C) 提出 原 假设 所 和 备 择 公设 所 。 
Wh: =0: 局: 有 z0 
O 构造 检验 的 统计 量 ， 并 计算 其 值 





= 








归 系 数 























把 原 假设 及,:B =0 代 入 此 式 ， 有 SS 
_ A O 042 _ 042 9- 
Sa 457.21 
ú 14 282.92 SA 
G)a =0.05 ， 确 定 拒绝 原 假设 的 区 域 。 上 


o,- A U (taos (10), +0) 
E 上 分 布 表 可 得 mos(10)= 本 \\ 
(4) 统计 决策 。  - < 党 AN 


因为 1:=7.423 349 >to hss Aea 2.633767, Fi ožini, 即 回归 系数 显著 。 
最 后 检验 回归 系数 B= 


C) e BSE H main. p i 


A H, EDA :he0 
(2) 构造 ; 验 的 统计 量 ， 并 计算 其 值 。 











把 原 假设 H, A= 0 代入 此 式 ， 有 











[Ts 
S, A Ë 
À 1 + 7296.007 x45.721 
12 14282.92 


(3) wx=0.05 ， 确 定 拒绝 原 假 设 的 区 域 。 


(—,—toas (10)) U (oos(10),+oo) 
查 :分 布 表 可 得 mos(10)=2.633 767 。 


(4) 统计 决策 。 
为 :=23.829 46 > mos(10) = 2.633 767 ， 所 以 拒绝 原 假设 ， 即 回归 系数 显著 。 
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8.3 ”一 元 线性 回归 模型 的 预测 


回归 分 析 的 主要 目的 是 根据 所 建立 的 估计 回归 方程 进行 经 济 预测 和 经 济 控制 。 所 谓 预 
测 ， 是 指 通 过 自 变量 x 的 取 值 来 预测 因 变 量 y 的 取 值 。 控 制 是 指 通过 因 变 量 y 值 ， 求 出 自 
变量 x 的 值 。 这 里 主要 介绍 根据 估计 方程 进行 估计 和 预测 的 方法 ， 主 要 包括 点 估计 和 区 间 
估计 。 


8.3.1 点 估计 


定义 8.13 ”利用 估计 的 回归 方程 ， 对 于 x 的 一 Meets, Aitana 
点 估计 。 

点 估计 分 两 种 : 巴 平均 值 的 点 估计 ; @ 个 别 什 的 点 全 i 

定义 8.14 利用 估计 的 回归 方程， 对 于 x 的 一 个 特定 很 ， 求 出 的 平均 值 的 一 个 人 
计 值 E(y)， 称 为 平均 值 的 点 估计 。 

【 例 8.9】 沿用 例 8.1 中 的 数据 ， 利 Et 对 于 一 个 特定 值 m =90 ， 求 出 
切 平 均值 的 点 估计 。 

解 ， 平均 值 的 一 个 估计 值 为 CA 

E(w =124.20 +0.42 x90 =162., 

定义 8.15 利用 估计 的 回归 方程 对 于 x 的 一 个 特定 公 习 求 出 ， 的 一 个 个 别 值 的 估 
计 值 各 ， 称 为 个 别 值 的 点 千 计 < i 

【 例 8.10】 Ma, 让 的 数据 ， 和 用 舍 主 的 站 方程 ， 对 于 -个 特定 值 m =90， 求 
aE a J V 

解 : NI PARA 点 估计 为 x 

NAO j, =124.20 +0.42 x90 =162 

MA ETERA TT AE h, 在 点 估计 的 条 件 下 ， 对 于 同一 个 x,。， 平 均值 的 点 估计 

和 个 别 值 的 点 估计 的 结果 是 一 样 的 。 但 是 ， 两 者 在 区 间 中 则 有 所 不 同 。 


832 区间 估 计 

定义 8.16 ”利用 估计 的 回归 方程 ， 对 于 x 的 一 个 特定 值 RE y 的 一 个 估计 值 的 区 
间 就 是 区 间 估 计 。 
间 估 计 也 有 两 种 类 型 : 置信 区 间 估 计 和 预测 区 间 估 计 
定义 8.17 对 x 的 一 个 给 定 值 mW RE y 的 平均 值 的 估计 区 间 ， 这 一 区 间 称 为 置信 
区 间 。 
定义 8.18 ”对 x 的 一 个 给 定 值 x,， 求 出 y 的 一 个 个 别 值 的 估计 区 间 ， 这 一 区 间 称 为 预 
测 区 间 。 

1. 置信 区 间 估 计 

置信 区 间 估 计 是 对 一 个 给 定 值 *， 求 出 y 的 平均 值 的 估计 区 间 ， 即 求 出 E(y,) 的 区 间 
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范围 。 Dy = $, +, RP EE)=0, MUH EO )=EG) , Bl =Â, +Àx, IEO) 8 
估计 值 。 
己 知 房 和 房 都 服从 正太 分布 ,而 交 是 给 定 的 一 个 值 ， 所 以 名 = 房 + 房 mm 也 服从 正 态 分 
布 。 既 然 服从 正 态 分 布 ， 那 么 下 面 就 来 计算 其 方差。 
DS) = DÊ, + Àx.) 
= D(Ê,) + D(x) + 2cov(Ê,, Âx) 

















x° žá 1 
-人 Y > -ev 
其 中 cov(ĝ,, Ê) =cov(7 - ÂX ,Bb) 5 
=cov(y, Àx) —cov(AÀx, ÊD) > 
=0- a Ê) =—xD(ÓÀ.) aS 


OR E 


D0,) X?) +x —2x,x 你 二 > z 
° + - x), DEE x) 


ee SA a 吴 差 来 代替 , 但 此 时 是 服从 1 分 布 的 ， 


o; + 2 cov(ĝÂ,, Â.) 











有 
a 2 
YA RA Kt : T p (8.17) 
k (x, i; 
对 于 给 定 值 x ， Jy 均值 的 估计 区 间 为 





pitna- zh) (8.18) 
【 例 8.11】 沿用 例 8.1 中 的 数据 ， 求 12 家 企业 生产 费用 95% 的 置信 区 间 。(& = 0.05 ) 
解 : 根据 题 意 ， 置 信 区 间 为 
































on (1, -Ty 
Îi tt, (n—2)s, L] 825] 


其 中 ， 为 =162 s| (10)=2633767, s, =6.76 ， 所 以 有 
(90 —85.42)° J 





14 282.92 
= 162 + 2.633 767 x 6.76 x 0.291 208 
= 162 + 5.184 74 
即 置信 区 间 为 (156.815 3,167.184 7) 。 
2. 预测 区 间 估 计 
预测 区 间 是 指 对 x 的 一 个 给 定 值 , 求 出 y 的 一 个 个 别 值 的 估计 区 间 , BRE P +é H 
区 间 范 围 。 


162 土 2.633 767x 6.76x Ë + 
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从 上 面 的 分 析 中 可 知名 = Ê, +Àx, 28 EG) 的 估计 值 , 而 预测 区 间 估 计 是 求 负 + 名 的 范 
司 ， 比 置信 区 间 多 了 一 个 误差 项 扣 ， 即 














(x, —x) 


、 1 T (x 
DG sapno -| rT :J +o (i DE he 
同样 用 估计 的 标准 误差 来 代 蔡 方差 > ， 是 服从 1 分 布 的 ， 有 
































(x, — x) 
Sn = si toa- >) (8.19) 
对 于 给 定 值 x ， 求 出 y 的 平均 值 的 估计 区 间 为 
wD ⁄ 
£t (n > | (e nte% z > (8.20) 

















[J 8.12] 沿用 例 8.1 中 的 数据 ， 求 12 s. e. 
解 : 根据 题 意 ， 置 信 区 间 为 Ç ' 











JEH, $,=162, tas (10)=2.633767, A = 所 以 有 
SYS- (90—85.42) 
or 5 K. ) 
= 162222, Sex 676x 1 041538v,, < > 
= 162418:543 82 X M 
MWN 143.4580; 180.543 8) 。 xX pA 
DAA 


Y 
NG 8.4 SAREI 














在 实际 问题 中 ， 影 响 因 变量 的 因素 往往 有 很 多 ， 这 种 一 个 因 变 量 与 多 个 自 变量 的 回归 
问题 就 是 多 元 回归 。 当 因 变 量 与 各 自 变量 之 间 为 线性 关系 时 ， 称 为 多 元 线性 回归 。 多 元 线 
性 回归 分 析 的 原理 与 一 元 线性 回归 分 析 的 原理 基本 相同 ， 但 在 计算 上 要 复杂 得 多 ， 因 而 需 
要 借助 计算 机 来 完成 。 这 里 只 介绍 多 元 与 一 元 不 同 的 内 容 。 


8.4.1 多 元 线性 回归 模型 的 含义 
多 元 线性 回归 相对 于 一 元 线性 回归 不 同 的 是 自 变量 的 个 数 不 是 一 个 ， 而 是 多 个 ， 即 两 
个 及 两 个 以 上 。 
定义 8.19 ”描述 因 变量 y 如 何 依赖 于 自 变 量 x*,x, ,…,x 和 误差 项 < 的 方程 ， 称 为 多 元 


线性 回归 模型 。 
多 元 线性 回 
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模型 的 一 般 形式 可 表示 为 

y= +Ñ + B,x, ++ B,x, +Š (8.21) 
IP, Abobo B, 883123; ¿£ 为 误差 项 。 与 一 元 线性 回归 类 似 ， 我 们 对 误差 项 有 
同样 的 基本 假定 
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定义 8.20 描述 y 的 期 望 值 如 何 依赖 于 x,x, ，…xx 的 方程 ， 称 为 多 元 线性 回归 方程 ， 即 
E(y)= A, + Ax + BX ++ pX (8.22) 
于 回归 方程 中 的 参数 A,A. B... B, 是 未 知 的 ， 因 而 需要 利用 样本 数据 去 估计 它们 。 
在 用 样本 统计 量 房 , 房 , 房 ,…, B), 估计 回归 方程 中 的 未 知 参数 局 ,B, 忆 ,…, ,时 ， 就 得 到 了 
估计 的 多 元 回归 方程 。 
定义 8.21 根据 样本 数据 得 到 的 多 元 线性 回归 方程 的 估计 ， 称 为 估计 的 多 元 线性 回归 
方程 。 

































































b=B+ Êx + Dx, +t Óx, (8.23) 
842 ”最 小 二 乘法 


六 
EERI Ô À. Âr À 仍然 是 根据 最 小 二 科 法 求 得 < K 
L =, - $) = 5:G@, - À, -Êx — r sa > Boy 

















óL , 六 二 
aB << Y N 
En WT (8.24) 
VR RY 
要 从 上 面 方程 组 中 ' 解 出 参数 的 信 计 全 | 上 需要 借助 计算 机 来 完成 。 
843 ”样本 回归 方程 的 评价 > x 








类 似 于 一 元 回归 ， #-E2 umita E, EERUN E TIUM 6 tU. 
这 里 采用 的 指 ARN :是 修正 多 重 判定 系数 ; -二 是 估计 标准 误差 。 其 中 估计 标准 误差 
同一 元 的 计算 公式 相同 aka... ` ¿saad 了 修正 。 这 里 只 介绍 修 
正 的 多 重 判定 系数 
Wy arusata Yi 分 解 ， 这 一 点 同样 适用 于 多 元 回归 中 因 变 
量变 差 平方 和 的 分 解 ， 即 














SST = SSE +SSR 
式 中 ，SST= F (y, -y) 为 总 平方 和 ; SSR = ($, - y) 为 回归 平方 和 ;SSE= (y, - $) 
为 残 差 平方 和 。 

定义 8.22 在 多 元 回归 中 ， 回 归 平方 和 占 总 平方 和 的 比例 ， 称 为 多 重 判定 系数 。 其 计 
算 公 式 为 

















_SSR _j_ SSE 
SSE SST 
由 于 自 变量 增加 时 ， 预 测 误差 会 变 得 比较 小 ， 从 而 减少 残 差 平方 和 SSE; 由 于 回归 平方 和 
SSR=SST-SSE， 因 此 当 SSE 变 小 时 ，SSR 就 会 变 大 ， 进 而 使 R 变 大 。 因 此 ， 如 果 模 型 中 
增加 了 一 个 自 变量 ， 那 么 即使 这 个 自 变 量 在 统计 上 并 不 显著 ，R? 也 会 变 大 。 为 避免 因 增 力 
自 变量 而 高 估 R*, 统计 学 家 提出 用 样本 量 n 和 自 变量 个 数 去 修正 R*， 以便 计算 出 修正 的 
多 重 判定 系数 。 
定义 8.23 ”用 模型 中 自 变量 的 个 数 和 样本 量 进行 调整 的 多 重 判定 系数 ， 称 为 修正 的 多 

重 判定 系数 ， 记 为 R*? 。 其 计算 公式 为 
NOR》 
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(8.25) 


844 ”显著 性 检验 


在 一 元 线性 回归 中 ， 线 性 关系 的 检验 (F 检验 ) 与 回归 系数 的 检验 (1 检验 ) 是 等 价 的 ， 这 
一 点 很 容易 理解 。 因 为 一 元 线性 回归 只 有 一 个 自 变量 。 但 在 多 元 回归 中 ， 这 两 种 检验 不 再 
等 价 。 线 性 关系 检验 主要 是 检验 因 变 量 与 多 个 自 变量 的 线性 关系 是 否 显著 ， 在 k 个 自 变量 
中 ， 只 要 有 一 个 自 变量 与 因 变 量 的 线性 关系 显著 ，F 检验 就 能 通过 ， 但 这 不 一 定 意味 着 每 
个 自 变 量 与 因 变量 的 关系 都 显著 。 回 归 系数 检验 则 是 对 每 个 回归 系数 进行 单独 的 检验 ， 它 
主要 用 于 检验 每 个 自 变量 对 因 变 量 的 影响 是 否 显著 。 如 果 某 个 自 变 量 没有 通过 检验 ， 就 意 
味 着 这 个 自 变 量 对 因 变 量 的 影响 不 显著 ， As 7 na x 
部 分 内 容 主要 通过 案例 来 介绍 。 < 


8.5 ROID: MEBANE H Excel 上 机 
应 用 一 啤酒 销售 量 预测 
XN 
回归 分 析 常 用 的 方法 是 向 后 消去 法 7 a 逐一 消除 没 
有 预测 效果 的 项 目 。 这 里 以 性 别 、 年 SS 5 喝 过 啤酒 、 何 种 品牌 、 啤 酒 印 象 为 解释 变量 ， 
元 加 月 分 析 ， 以 向 后 消去 法 最 后 得 出 一 个 有 效 的 回归 
Ny 
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是 否 购买 为 被 解释 变量 ， 建立 < 
预测 模型 。 A 


- V 
建立 一 个 新 的 工作 表 ， 命 名 为 “回归 分 析 ” j je: “性 别 ”““ 年 龄 ”““ 是 否 
喝 过 啤酒 ” “masus” AERAR” 和 再 次 购买" 数据 复制 到 回归 分 析 工 作 表 
š ST 


x AZ 
下 oa 








A B G D E F 
性 别 Era 是 否 喝 过 啤酒 最 常 喝 的 品牌 哩 酒 印象 分 获 再 次 购买 
2 1 A 1 2 1 
š 2 £ 2 ° š 
1 2 1 2 Ç. 1 
2 1 2 2 2 š 
2 1 1 4 r 1 
š 2 i £ a 2 
z 1 rt 2 -1 2 
2 1 3 2 7 1 
1 2 1 z 11 1 
1 3 i 1 ° 1 
z 2 £ z z 1 
1 3 1 š ° 1 
i 3 $ 2 "u" 1 
2 1 1 i -1 2 
2 1 1 1 7 1 
1 3 1 2 i 1 
1 2 1 2 12 1 
1 4 1 2 1 
2 2 ` 1 1 
1 2 1 11 1 
1 1 11 1 
AAA EAN pai ELODO < 








8.7 “回归 分 析 ” 工 作 表 


为 了 研究 变量 “是 否 喝 过 啤酒 ”是 否 影响 “再 次 购买 ” 将 C15 单元 格 和 D15 单元 格 
的 数值 改 为 0， 如 图 8.8 所 示 。 








EY/ 








== 第 ç$ = 
一 amanss 
相关 与 一 元 回归 分 析 ,5 
A B G D 

1) #s F5 ë ETSHRE #RSHRS MEF asa CETA 

2 2 1 1 1 1 

3 1 z 1 z ° 1 

4 n 2 1 2 T 1 

5 2 1 1 2 2 1 

6 2 1 1 4 7 1 

7 1 2 1 1 n" 1 

s 2 1 1 2 -1 

° 2 1 1 2 1 

10 1 2 1 z N" 1 

11 1 3 1 1 ° 1 

12 z z 1 2 2 1 

13 1 1 2 9 1 

14 1 7 u 1 

15 z 1 ° ° -1 

16 z 1 ao V 7 1 

17 L T 3 n" 1 

18 š i! 2 12 1 

19 1 i 1 3 2 1 

20 z 1 2 1 1 

21 1 1 3 u 1 

22 £ 1 1 2 11 ra 





图 8.8 将 C15 单 元 格 和 D15 em 
建立 五 元 线性 回归 预测 模型 步骤 如 下 。 FADA 
析 ” 


第 一 步 : 在 回归 分 析 工作 表 的 界面 ， 单 击 “ 数 一 “数据 分 析 ” 按 钮 
mu “88894” AEE, E ATLI NORE 可 归 ” 选 项 ， 如 图 8.9 所 示 。 





























X 图 8.9 “数据 分 析 ” 对 话 框 
ARTE” ut, muyay ”对 话 框 ， 在 “Y 值 输入 区 域 ”文本 框 中 输 
:$F$317, TE “X 值 输入 区 域 ” 文 本 框 中 输入 “SAS$1:SE$31”， 选 择 “ 标 志 ” 和 “ 置 
信 度 ” 复 选 框 ， 其 中 的 置信 度 默 认为 “95%“， 选 中 “输出 区 域 ” 单 选 按钮 ， 并 在 其 文本 
框 中 输入 输出 结 果 “$H$9”， 如 图 8.10 所 示 。 
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IE 
Dxaxeo 
区 |x 














图 8.10 “回归 ”对 话 框 1 


SSE 


统计 学 ( ) 理论 5 实务 — í í í 




















2 = La » = 
第 三 步 : 单 击 “确定 ”按钮 ， 出 现 如 图 8.11 所 示 的 分 析 结 果 。 
ET 
ET 
ipen O Tasas 
|R Square 0. 606137354 
|Adjusted R Sc 0. 524082636 
asas o. 175025031 
df Significance F 
亲生 S LAASI 2262275 TC 386903683 oe 
pe 24 0.735210273, 0 03063ST61 
区 29 1. 866666667 
Toatti cients tle oer Ger = 
RE 2. 990003090 0. 325505213 7, 230087307 1. T0073E O7 1. bh030105 3. 020040007 T. 604090105 3, 0004001 
hesi -0.156909927 0. 125228882 -1. 252905137 0. 222281961 -0. 4183696340. 101548779 -0. 41536963 ©. 10154978 
ES T0. 075416308 0. 051876464 -1 463767221 0. 158963656 -0. 182484062 0. 031651456 -0, 18248406 0. 03165146| 
emija <o. T20147878 0. 216198111 -3. 351625489 0. 002787937 -1. 166270097. -0 2740: 662701 ~. 2740257] 
laveaa CO. 007531198 0. 041996814 -0.179327834 0. 859189671 -0. 094208362. 0.079145 -0109420836 0. 07914887] 
06 0. 014017536 -2. 309325915 0. 029844544 0. 061301852 “0, 00344024. 06130193 -0. 0034403 
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图 8.11 分 析 结 果 1 
从 图 8.10 的 报表 中 ， 可 以 得 出 以 下 结 
a) BTML qea mis oss 002 Q 
酒 之 间 存 在 回归 关系 ， 而 回归 模型 的 解释 能 为 和 等 因为 此 值 越 接近 
越 强 。 < 
D HJ/2220036 s kO, R “ü den F=7.386 989 665, 


0.000 256 788， 这 个 值 非常 小 ， 所 以 结论 为 拒绝 原 假设 ， 
与 未 来 购买 啤酒 之 间 存 在 显著 性 的 相关 性 。 
e 


和 EEE 

niasin :Bs 
检验 的 统计 量 为 1 检验 那么 性 别 、 年 龄 、 是 常 喝 的 品牌 、 
项 因素 所 天 应 的 甩 慎 分 别 为 0.222 2819 a Ne 656、0.002 787 937、 
0.029 A PETEERE 印象 分 数 的 P 值 小 于 0.05 ， 
酒 和 啤酒 印象 分 数 与 未 来 是 否 购买 啤酒 存在 相关 性 。 这 时 选择 消除 P 值 最 
建立 一 个 四 元 回归 模型 。 

2. 建立 一 个 四 元 线性 回归 预测 模型 





rapt 会 购买 只 


1， 代 表 解 释 能 力 
对 应 的 P 值 为 
即 表示 5 项 因素 


0; H:p 0, 
啤酒 印象 分 数 5 
0.859 185 671、 

说 明 是 否 喝 过 啤 


大 的 对 应 的 变量 ， 


第 一 步 : 把 “性 别 ” “年龄 ”“ 是 否 喝 过 啤酒 “啤酒 印象 分 类 ”和 “再 次 购买 ” 数 





加 





据 复 制 到 “回归 分 析 “ 工 作 表 

第 二 步 : 单 击 “ 数 据 ” 一 
在 “分 析 工 具 ” 列 表 中 选择 “ 回 规 ” 选 项 ， 如 图 8.9 所 示 ， 然 后 单 和 
“回归 ”对 话 框 ， 在 “Y 值 输入 区 域 ” 文 本 框 中 输入 “$E$37:SE$67”， 
文本 框 中 输入 “$A$37:8D$67”， 选 择 “ 标 志 ” 和 “置信 度 ” 复 选 框 ， 其 
“95%”, 选中 “输出 区 域 ” 单 选 按钮 ， 并 在 其 文本 框 中 输入 “SFS$43 ”名 








J A37:E67 单元 格 








回 




















Wh 


区 域 中 ， 如 图 8.12 所 示 。 

“分 析 ” 一 “数据 分 析 ” 按 钮 ， 弹 出 “数据 分 析 ” 对 话 框 ， 

fF“ 确定 ”按钮 ， 弹 出 
在 “X 值 输入 区 域 ” 


的 置信 度 默 认为 
图 8.13 所 示 。 








== 


& = 
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37 性 别 Fi EERIRE misma =m 再 次 购买 























CE [seson [sJ 
x 值 输入 区 域 &) (SAS37 90967 [e] 
回 标志 中 gato 
gry s jw 
Sie 
名 篇 区 城中 EE 
ONIRE 
OI 人 ff 
nE 
oazo 
Dres 
Esam - 
DEst8zmo / 
FX 
NON y 
图 8.12 A37:E67 单元 格 区 域 qs “回归 ”对 话 框 2 
第 三 步 ， 单 击 “ 确 定 ”按钮 ， 出 现 如 图 8.14 TOATA 


Sigue F 
5| 9.597241831 “V82195Ej05 











PEIRET] 
PERTEN 





844 分析 结果 2 


从 图 8.14 的 报表 中 ， 可 以 得 出 以 下 结论 。 

(1) 由 修正 的 多 重 判定 系数 值 为 0.542 507 139， 可 知 此 4 项 因素 与 未 来 是 否 会 购买 啤 
酒 之 间 存 在 回归 关系 ， 而 回归 模型 的 解释 能 力 为 中 等 。 

(2) 由 方差 分 析 检 验 结果 来 看 ，F 检验 的 统计 量 为 9.597 241 831， 对 应 的 P 值 为 
7.62195x10”， 这 个 值 非常 小 ， 所 以 结论 为 拒绝 原 假设 ， 接 受 备 择 假设 ， 即 表示 4 项 因素 
与 未 来 是 否 购买 啤酒 之 间 存 在 显著 性 的 相关 性 。 

(3) 各 项 系数 的 检验 。 检 验 的 统计 量 为 :+ 检验， 那么 性 别 、 年 龄 、 是 否 喝 过 啤酒 、 啤 酒 
印象 分 数 4 项 因素 所 对 应 的 P 值 分 别 为 0.217 600 707、0.150 312 017、0.000 793 195, 
0.026 723 205。 同 样 只 有 是 否 喝 过 啤酒 和 啤酒 印象 分 数 的 P 值 小 于 0.05 ， 说 明 是 否 喝 过 啤 
酒 和 啤酒 印象 分 数 与 未 来 是 否 购买 啤酒 存在 相关 性 。 这 时 选择 消除 P 值 最 大 的 对 应 的 变 
量 ， 建 立 一 个 三 元 回归 模型 。 
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统计 学 ( ) 理论 5 实务 — í í í 


3. 建立 一 个 三 元 线性 回归 预测 模型 


第 一 步 : 把 “年 龄 ”“ 是 否 喝 过 啤酒 ?“ 啤 酒 印 象 ”和 “再 次 购买 ”数据 复制 到 “ 
分 析 “ 工 作 表 的 A76:D106 单元 格 区 域 中 ， 如 图 8.15 所 示 。 
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W 
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b 2 ë b Q — — Q Q o Q ne = o = = o o = Ë. 


B c D 
是 否 喝 过 啤酒 啤酒 印象 分 数 再 次 购买 
š 


Pep 
VA 











~) 了 ma, 5 A76:D106 单元 


第 二 步 : 单 击 “ e D A 弹出 “数据 分 析 ” 对 话 框 ， 
在 ANLA” paii “回归 ”选项 ， 如 示 ， 然 后 单 击 “确定 ”按钮 ， 弹 出 
“回归 ?” eg. wa 值 输入 区 域 ”文本 框 中 输 TAA $D$106”, 1E “X 值 输入 区 域 ” 
文本 框 中 输入 “SA376:SCS106”， 选择“ 标志 ”和 “置信 度 ” 复 选 框 ， 其 中 的 置信 度 默 认 
为 “95%”， “输出 区 域 ” 单 选 按钮， 间 在 其 文本 框 中 输入 “$F$86”， 如 图 8.16 所 示 。 





输入 
r mammo: 


X BRAEM: ss76:sc$106 (EE) 


grs 
aE u da 



































图 8.16 “回归 ”对 话 框 3 
第 三 步 : 单 击 “确定 ”按钮 ， 出 现 如 图 8.17 所 示 的 分 析 结 果 。 





BW 


相关 与 一 元 回归 分 析 .s: 系 各 S 





SUMMARY OUTPUT 


回归 统计 

Multiple R 0.7 7 

R Square 0. 580: 
Adjusted R Sq. 0.3; 











标准 误差 0. 173571633. 
观测 信 30 
方差 分 析 

df SS MS F ignificance F 
回归 分 析 3 1.083361763 0.361120588 11.98656516 4. 0884E-05 
B= 26 0.783304904 0. 030127112 
Bit 29 1. 866666667 








Coefficients MERS 
Intercept 2. 017200812 0. 178 
年 龄 


t Stat P-value — Lower 95% Upper 95% 下 限 95.0% ， 上 限 95.0% 
11.28637827 1.61091E-11 1.649818511 2.384583112 1.649818511 2.384583113 

$ -0. 03; 0. 040541629 -0. 88492358 0. 384308777 -0. 11921075 0. 047458267 -0. 119210753 0. 047458267] 
是 否 喝 过 啤酒 。，-0.7833049 0. 191456285 -4. 09129898 0. 000368322 -1. 17684893 -0. 38976088 #1. 17684893 -0. 38976087: 
IAES 0. 01867543 0. 008685064 -2. 14955029 0.041070926 -0. 036534 -0. SR <。 00081655] 

















Fr 
图 8.17 分 析 结果 3 , XS 


从 图 8.17 的 报表 中 ， 可 以 得 出 以 下 结论 。 ; `Ë 
(1) 由 修正 的 多 重 判定 系数 值 为 0.531 953 8, T. TA 页 因素 与 未 来 是 否 会 购买 啤酒 
之 间 存在 回归 关系 ， pe a s 

O 由 方差 分 析 检 验 结果 来 看 ， 玉 DS : 量 为 11.966 565 16， 对 应 的 P 值 为 
4.088 4x10* ， 这 个 值 非常 小 ， 所 以 结 ; We 假设 ， 接 受 备 择 假设 ， 即 表示 3 项 因素 
与 未 来 是 否 购买 啤酒 之 间 存 在 显著 性 的 相关 往 。 

(3) 各 项 系数 的 检验 。 各 项 系 2 Hep E0: 
检验 的 统计 量 为 检验 ， 那 女 第 只: 是否 喝 过 啤酒、 we 3 项 因素 所 对 应 的 P 值 
分 别 为 0.384 308 777, 0:000 368 322、0.041 070 926 忆 还 是 只 有 年 龄 的 回归 系数 不 显著 ,这 
时 选择 消除 P 值 最 大 的 对 应 的 变量 ， r-t 模型 。 

4 建立 一 从 二 元 线性 回归 预测 模型 外 

J 

mg ETI” AO gn “ HKD 3: ” 数据 复制 到 “回归 分 析 ” 

工作 表 的 Al10:C140 单元 格 区 域 中 ， 如 图 8.18 所 示 。 
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NOESTE REEI EEE 3 再 次 购买 
111 1 2 
112 1 

113 1 

114 1 

115 1 

116 $ 

117 1 

118 1 

119 1 

120 1 

121 1 

122 1 5 
123 1 

124 ° 

125 1 

126 1 

127 1 

128 1 

129| 1 

130 1 

131 1 

OD, n EAEAN EET SE ORDAN FARETRAR ARGAN 回归 分 析 


8.18 A110:C140 单元 格 区 域 





SSE 


mpa a 


第 二 步 : 单 击 “ 数 据 ” 一 “分 析 ” 一 “数据 分 析 ” 按 钮 ， 弹 出 “数据 分 析 ” 对 话 框 ， 

在 “分 析 工 具 ” 列 表 中 选择 “回归 ”选项 ， 如 图 89 所 示 ， 然 后 单 击 “ 确 定 ” 按 钮 ， 弹 出 
“回归 ”对 话 框 ， 在 “Y 值 输入 区 域 ” 文 本 框 中 输入 “$CS$110:$C$140”， 在 “X 值 输入 区 域 ” 
文本 框 中 输入 “$AS$110:$B$140”， 选 中 “标志 ”和 “置信 度 ” 复 选 框 ， 其 中 的 置信 度 默 认 


为 “95%”， 选 中 “输出 区 域 ” 单 选 按 钮 ， 并 在 其 文本 框 中 输入 “$D$118” 如 图 8.19 所 示 。 
回归 回国 


输入 
Y ERAKU): sc$110:$c$140 EE (mE m) 





























































































































x 值 输入 区 域 名 ) : $A$110:$5$140 国 me 
JEEV 了 zho 
TJEERD s js 

输出 选项 Ja kA 

OMHE: [su E / NI 
O 新 工作 表 担 @@): ] k <> N 
O Tis Z 
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第 三 步 : t aE” BH; DR 8.20 所 示 


SUMMARY OUTPUT > Y 

















图 8.20 分 析 结 果 4 
从 图 8.20 的 报表 中 ， 可 以 得 出 以 下 结论 。 


(1) 由 修正 的 多 重 判定 系数 值 为 0.535 713 949， 可 知 此 两 项 因素 与 未 来 是 否 会 购买 啤 
酒 之 间 存 在 回归 关系 ， 而 回归 模型 的 解释 能 力 为 中 等 。 

(2) 由 方差 分 析 检 验 结果 来 看 ，F 检验 的 统计 量 为 17.730 746 61， 对 应 的 P 值 为 
1.209 61x10“”， 这 个 值 非常 小 ， 所 以 结论 为 拒绝 原 假设 ， 接 受 备 择 假设 ， 即 表示 两 项 因素 
与 未 来 购买 啤酒 之 间 存 在 显著 性 的 相关 性 。 

(3) 各 项 系数 的 检验 。 各 项 系数 的 原 假设 和 备 择 假设 分 别 为 H,:pB=0; H.:A 0, 
检验 的 统计 量 为 1 检验， 那么 是 否 喝 过 啤酒 、 啤 酒 印象 分 数 这 两 项 因素 所 对 应 的 P 值 分 别 


BWW 









































为 0.000 214 096, 0.029 161 027， 均 小 于 0.05， 表 示 这 两 项 因素 与 未 来 是 否 购买 啤酒 之 间 
有 非常 显著 性 的 关系 。 因 此 ， 该 二 元 回归 预测 模型 为 最 简单 也 是 最 具有 解释 能 力 的 预测 


模型 。 


一 、 单 项 选择 题 


N 


x 


D 


x 


oo 


w 


A. 相关 关系 


A. 相关 系数 


A. 正 线性 相关 关系 
cC. 直线 性 关系 
， 根 据 相 关系 的 特点 ， 


A. 0.89 











习 题 


.变量 之 间 存 在 的 不 确定 的 数量 关系 ， 称 为 ( —)- 


B. 函数 关系 C. 线性 关系 D. 非 线 性 关系 


.两 变量 的 样本 之 间 的 关系 强度 采用 ( )- 


.根据 图 8.21， 可 以 判断 两 个 变量 之 间 存 在 (  )- 


B. 判定 系数 Gi R: ee 





y 





Z 


— — t Q £ Q O. — % 











5 < 
图 8.21 mam. 


EB fA8RIEHIDEOE E 


也 ”函数 关系 
下 面 的 相关 系数 取 值 错 误 的 是 ( e 
B. 1.03 C. -0.5 D. 0 


. 下面 关 于 相关 系数 叙述 错误 的 是 ( Je 


A. y 的 取 值 范 围 为 ， -1<y<1 


B. y 具有 对 称 性 


C. y 的 大 小 与 x 和 yy 的 原点 及 尺度 无 关 
D. y 的 取 值 范围 为 0<y <1 





.计算 儿童 身高 和 年 龄 的 相关 系数 时 ， 其 中 身高 采用 “cm” 比 “m” 的 相关 系数 (。”)。 


A. 增加 B. 减少 C. 不 变 D. 不 确定 
. Excel 中 的 相关 系数 函数 为 ( 。 )。 

A. CORREL B. MODE C. STEDV D. AVERAGE 
. 在 相关 关系 的 显著 性 检验 中 ， 原 假设 和 备 择 假设 为 ( —)- 

A. H,:p=0,H,:p*0 B. H;:r=0,H,:r=0 


C. H,:p>0HR,:6<0 D. H,:p<0H:p>0 


A. 标准 正 态 


. 在 相关 系数 的 显著 性 检验 中 ， 检 验 的 统计 量 是 (  )- 


B f CF D. 好 


Ww 


统计 学 ( ) 理论 5 实务 — í í í 





















































10. 样本 的 回归 方程 名 = 房 + 房 s 中 ， 参 数 估计 值 的 估计 方法 是 ( e 

A. 最 小 二 乘法 B. 极 大 似 然 估计 法 

C. 点 估计 D. fiit 
11. 最 小 二 乘法 是 指 所 有 点 到 直线 距离 平方 和 最 小 ， 其 中 距离 指 的 是 (  )。 

A. 竖 直 距离 B. 水 平 距离 C. 垂直 距离 D. 以 上 都 不 对 
12， 样 本 的 回归 方程 方 = 房 + 房 5 中 ， 扇 和 房 的 关系 ( 。 )。 

A. 相关 B. 不 相关 C. 不 确定 D. cowÀ,, Bp)=0 
13. 判定 系数 R 的 取 值 范围 为 ( —). 

A. [0,1] B. [-1,1] C. [-1,0] D. [0,+%] 
14. 在 一 元 线性 回归 分 析 中 ， 总 平方 和 服从 x? 分 布 ， — Ú. $ 

A. n-1 B. 1 €. 2 oj 人 
15. 在 线性 回归 分 析 中 ， 回 归 平 方 和 服从 z? "i: 其 自由 度 为 ( 








A. n-l B. 1 & 


16， 在 线性 回归 分 析 中 ， 残 差 平方 和 服从 z? i A 
n=2 








A. n-l B. 1 GZ 
17.。 残 差 均 方 的 平方 根 ， 称 为 ( 。 )。 y% 
A， 佑 计 标准 误差 a 3 
C. 回归 平方 和 K 平方 和 
18， 估 计 标准 误差 是 反映 实际 观 sX PREIEI RMH S ZMA 其 中 s. 为 
( H, RB, S N 
A. 0 ay Pp! — 
19. TERPEN 8 050 h 0360963 EAEC uk a 
A. 标准 正 态 Bt 


20. 在- rik 归 分 析 中 ， oo ) 分 布 。 
NS B. t D. > 
二 、 多 项 选择 


1. 对 样本 回归 方程 进行 评价 的 指标 有 ( )- 

A. R B. 估计 标准 误差 C. SSR D. SST 
2. 在 一 元 回归 模型 y= B+ Bx+ 中 ， 其 中 误差 项 & 的 满足 条 件 有 ( )e 

A. ¢~N(0,0’) B. cov(x,é)=0 C. x 是 非 随 机 的 ”D. cov(x,ë)# 0 
3. 判定 系数 R 的 计算 公式 为 ( )e 





























À. R= sr B: pase J Rs SSE p. g = SSR 
SST SST SSE 

¿esp akana, )。 

A. 线性 关系 的 检验 B. 回归 系数 的 检验 

C. 判定 系数 的 检验 D. 相关 系数 的 检验 
5. 根据 估计 方程 进行 估计 和 预测 的 方法 ， 主 要 包括 ( )e 

A. 点 估计 B. 区 间 估 计 

C. 平均 值 的 点 估计 D. 个 别 值 的 点 估计 


CE 


相关 与 一 元 回归 分 析 . :第 ,% 章 





1， 简 述 经 济 预测 和 经 济 控制 的 步骤 。 

2. 简 述 相关 分 析 的 步骤。 

3. 以 一 元 线性 回归 为 例 ， 简 述 最 小 二 乘法 的 思路 。 

4 以 一 元 线性 回归 为 例 ， 简 述 线性 关系 检验 和 回归 系数 检验 的 步骤 。 


四 、 计 算 题 
1. 一 家 超市 集团 拥有 多 家 子 超市 ， 公 司 的 管理 者 想 通 过 广告 支出 来 估计 销售 收入 ， 为 此 他 随机 抽取 
了 7 家 子 超市 ， 得 到 广告 支出 和 销售 收入 的 数据 见 表 8-2 所 示 。 
表 8-2 广告 支出 和 销售 收入 数据 


单位 : 万 元 


广告 费用 支出 “销售 额 
1 19 
2 32 
4 44 
6 40 
10 52 
14 53 
20 54 


问题 : 

(1) 试 画 出 广告 费用 支出 与 销售 额 的 散 4 

(2) 计算 广告 费用 支出 与 销售 额 的 关 

(3) 对 广告 费用 支出 与 销售 额 

(4) 利用 最 小 二 乘法 ， 计 算 样 广 告 费用 支出 与 销售 额 的 样本 回归 方程 。 

(5) 评价 样本 回归 方程 。 

(6) 写 出 广告 费用 支出 与 销售 额 进行 线性 关系 和 回归 系数 检验 过 程 。 

2. 根据 某 8 个 地 区 的 人 均 可 支配 收入 ( y ) 与 人 均 消 费 水 平 (x ) 的 数据 ， 得 到 8-3 和 表 8-4 所 示 的 结果 。 
(a=0.05) 










图 


表 8-3 方差 分 析 表 






E F-crit 
8.481 19E-06 | 5.9874 















53 845.02 
1 798 550.42 















表 8-4 参数 估计 表 






Cofficients 标准 误差 
5 050.5 867.783 5 0.000 
0.658 













Intercep 


X Variable 











(1) 完成 方差 分 析 表 和 参数 估计 表 。 
(2) 根据 参数 估计 表 ， 写 出 回归 方程 。 


(3) 根据 方差 分 析 表 ， 评 价 样本 
(4) 写 出 线性 关系 检验 的 步骤 。 











回归 方程 。 








(5) 写 出 自 变量 回归 系数 的 检验 步骤 。 








(6) 其 中 某 个 地 区 的 人 均 可 支配 
区 间 估 计 。 








KAJ 27873 元 , 预测 该 地 





区 的 人 均 消费 水 平 的 置信 





Mh 





区 间 估 计 和 预测 


附录 “用 Excel 生成 概率 分 布 表 

















利用 Excel 提供 的 统计 函数 “NEORMSDIST” 可 以 生成 标准 了 


附 表 1 标准 正 态 分 布 表 。 








EX4 


CLAN 


表 ， 即 P(Z < )。 生 成 标准 让 态 分 币 累 积 概率 分 布 表 可 按 以 下 步 又 进行 。 
第 一 步 : 将 x 的 值 《可 从 读者 需要 自行 确定 ) 输入 到 工作 表 的 A 列 ， 将 x 取 值 的 尾数 
输入 到 第 1 行 ， 形 成 标准 正 态 分布 的 表 头 ， 如 证 图 所 俱 


7 布 的 累积 概率 分 布 


TD 





x` N 6, 00 
` NZ 


` 





SIPP sd 33 


= 
o 





第 二 步 : 在 B2 3 


0.01 | 0.02 | 0.03T30.0od | 0.05 0.06 


外 元 格 输入 公式 “=NORMSDIST(SA2+B$1D”， 








0. 07 


0.08 | 0.09 














其 余 结 


可 通过 向 





向 右 复制 而 得 到 。 可 根据 需要 生成 不 同 x 的 标准 正 态 分 布 概率 表 ， 现 将 按照 上 述 方法 生成 
的 部 分 结果 展示 如 下 表 : 

















统计 学 (C) 理论 与 实务 
"| S N: D | gojeg É I ji 
x 0.00 001| 0.02 003| 0.04 005| 006 00 0.08| 0.09 
0.0 0.5000 0.5040 |0. 5080 0.5120 | 0. 5160 0.5199 | 0.5239 |0. 5279 0.5319 |0. 5359 
0.1 0.5398 0.5438 | 0. 5478 0.5517 |0. 5557 0.5596 |0. 5636 |0. 5675 0. 5714 |0. 5753 
0.2 0.5793 0.5832 |0. 5871 | 0.5910 |0. 5948 0.5987 |0. 6026 |0. 6064 0.6103 |0. 6141 
0.3 0.6179 0.6217 |0. 6255 0.6293 |0. 6331 0.6368 |0. 6406 |0. 6443 |0. 6480 |0. 6517 
0.4 0.6554 0.6591 |0. 6628 0.6664 |0. 6700 0.6736 |0.6772 |0. 6808 0. 6844 |0. 6879 
0.5 0.6915 0.6950 |0. 6985 | 0.7019 |0. 7054 | 0.7088 |0. 7123 |0. 7157 |0. 7190 |0. 7224 
0.6 0.7257 0.7291 |0.7324 0.7357 |0. 7389 0.7422 | 0.7454 |0. 7486 0.7517 |0. 7549 
0.7 0.7580 0.7611 |0. 7642 0.7673 |0. 7704 0.7734 |0. 7764 0.7794 0.7823 |0. 7852 
0.8 0.7881 0.7910 |0. 7939 0.7967 |0. 7995 0.8023 |0.8051 |0. 8078 0.8106 |0. 8133 
0.9 0.8159 0.8186 | 0. 8212 0.8238 |0. 8264 0.8289 | 0.8315 |0. 8340 0. 8365 |0. 8389 
1.0 0.8413 0.8438 |0. 8461 0.8485 |0. 8508 0.8531 0.8554 |0. 8577 0.8599 |0. B621 
1.1 0.8643 0.8665 |0. 8686 0.8708 |0. 8729 0.8749 | 0.8770 0.8790 0. 8810 |0. 8830 
1.2 0.8849 0.8869 |0. B888 0.8907 0.8925 0.8944 |0. B962 X980 0.8997 |0. 9015 
1.3 | 0.9032 0.9049 |0. 9066 0.9082 |0. 9099 0.9115 |0. 91314 0.9947 0. 9162 |0. 9177 
1.4 0.9192 0.9207 | 0.9222 0.9236 |0. 9251 0.9265 0.9279 09292 0.9306 |0. 9319 
1.5 0.9332 0.9345 |0. 9357 0.9370 |0. 9382 0.9394 0.9406. 0. 9418 0.9429 |0. 9441 
1.6 0.9452 0.9463 | 0. 9474 0.9484 |0. 9495 0.950540. 9515 0.9525 0.9535 |0. 9545 
1.7 0.9554 0.9564 |0.9573 0.9582 |0.9591 0. 9599-0. 9608 0.9616 0.9625 |0. 9633 
1.8 0.9641 0.9649 |0. 9656 0.9664 |0. 9671 0.9678. 0. 9686 0. 9693 0. 9699 |0. 9706 
1.9 (0.9713 0.9719 |0. 9726 0.9732 |0. 9738\\ 0.9756 0.9761 |0. 9767 
2.0 0.9772 0.9778 |0. 9783 0.9788 |0. 793 0X 0.9808 0.9812 |0. 9817 
2.1 (0.9821 0.9826 0.9830 0.9834 |0.,9888 9. 0. 9850 0. 9854 |0. 9857 
2.2 0.9861 0.9864 |0. 9868 0. 987x |0. 9873 0. 0. 9884 0. 9887 |0. 9890 
2.3 0.9893 0.9896 |0. 9898 0. 9901 10. 9904 oO. 0.9911 0.9913 |0. 9916 
2.4 0.9918 0.9920 |0. 9922 0.9925. 0.9927 0. 0. 9932 0. 9934 |0. 9936 
2.5 0.9938 | 0.9940 | 0. 99d1\Q>9943 ”0. 9945 0. 0.9949 0.9951 |0. 9952 
2.6 0.9953 0.9955 |0. 9956 0.9057 | 0. 9959 0. 0. 9962 0. 9963 |0. 9964 
2.7 0.9965 0.9966 | 09967 0:9968 |0. 9969 0. 0. 9972 0.9973 |0. 9974 
2.8 0.9974 0.9975 09976 0.9977 0.9977 0. 0.9979 0. 9980 | 0. 9981 
2.9 0.9981 0.9982 | 0:9982 0.9983 0.9984 0. 0.9985 0.9986 |0. 9986 
3.0 0.9987 0.9987~+0: 9987 0.9988 |0. 998870. 0.9983 0.9990 |0. 9990 
3.1 |0. 99990. 999] 0.9991 0.9991 0-9962 0. 0. 9992 |0. 9993 |0. 9993 
3.2 |0. 9993 10-9993 0.9994 0. 9994 0599940. 0.9995 | 0. 9995 | 0. 9995 
3.3 0 9995 0. 9995 0.9995 0.9996 -0.9996 0. 0.9996 0. 9996 |0. 9997 
3.4 [0,8997 0.9997 0.9997 0.9997 “0.9997 0. 0.9997 | 0. 9997 | 0. 9998 
3.5 | 0.9558 0.9998 0.9998 0.9998 0.9998 0. 0. 9998 | 0. 9998 | 0. 9998 
3.6 | 0.9998 | 0.9998 0.9999 0.9999 0.9999 |0. 0. 9999 | 0. 9999 | 0. 9999 
3.7 | 0. 9999 |0.9999 0.9999 0.9999 0.9999 0. 0. 9999 | 0. 9999 | 0. 9999 
3.8 | 0.9999 | 0.9999 0.9999 0.9999 0.9999 0. 0.9999 |0. 9999 |0. 9999 
3.9 |1.0000 |1. 0000 1.0000 1.0000 | 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.0 |1.0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.1 |1.0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.2 |1.0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.3 |1.0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.4 |1. 0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.5 |1.0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.6 |1. 0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.7 |1.0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.B |1.0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 
4.9 |1. 0000 |1. 0000 1.0000 1.0000 1.0000 1. 1.0000 |1. 0000 |1. 0000 








MP 








附 表 2 ”标准 正 态 分 布 临界 值 表 











利用 Excel 提供 的 统计 函数 “NORMSINV”， 可 以 生成 标准 正 态 分 布 的 临界 值 表 ， 临 界 
值 是 根据 标准 正 态 分 布 随机 变量 分 布 的 累积 概率 的 值 计算 的 。 如 果 有 P(Z<x)= p， 则 对 于 
任意 给 定 的 p(0 < p <1) 可 以 求 出 相应 的 x 。 用 Excel 生成 标准 正 态 分 布 临界 值 表 可 进行 如 
下 操作 。 

第 一 步 : 将 标准 正 态 变量 累积 概率 的 值 输入 到 工作 表 的 A 列 ， 其 尾数 输入 到 第 一 行 ， 
形成 标准 正 态 分 布 临界 值 表 的 表 头 ， 如 下 图 所 示 : 




































































| 
[a | = 0.000 0.001 |0.002 0.003 0.004 0.005 0,006 0.007 0.008 |0. 009 
2 |o. 50 < NN 
3 |o.51 
a |0.52 
| 5 |0.53 
| 6 |o.54 
7 | 0.55 
B |0.56 
o |o0.57 
| 10 | 0.58 
11 | 0.59 
| 12 | 0. 60 
[18 | 0. 61 
| 14 | 0.62 p 
| 15 | 0.68 N 
41610.6dt | 
17 | 0. 








输入 公式 “=NORMSINV(SA2+B$1D)”， 其 它 结果 通过 向 下 、 向 


右 复制 即 可 得 到 。 可 根据 需要 生成 不 同 p 值 的 标准 正 态 分 布 临 界 值 表 ， 按 照 上 述 步 又 操作 

















得 到 该 表 部 分 结果 如 下 图 所 示 : 
| 本 

E xX 0. 000 0. 001 0. 002 0.003 0.004 0.005 0.006 0. 007 0. 008 0. 009 
_2 10.50 0.0000 |0. 0025 0.0050 0.0075 [0.0100 0.0125 0.0150 0.0175 [0.0201 |0. 0226 
—3 |0.51 0.0251 0.0276 0.0301 0.0326 (0.0351 0.0376 (0.0401 0.0426 |0. 0451 |0. 0476 
— 4 |0.52 |0. 0502 [0.0527 0.0552 0.0577 |0. 0602 0.0627 (0.0652 0.0677 (0.0702 |0. 0728 
_5 |0.53 (0. 0753 [0.0778 0.0803 0.0828 |0. 0853 0.0878 (0.0904 0.0929 |0. 0954 |0. 0979 
_6 |0.54 (0.1004 |0.1030 0.1055 0.1080 [0.1105 0.1130 (0.1156 0.1181 [0.1206 |0. 1231 
_ 了 |0.55 (0.1257 [0.1282 0.1307 0.1332 |0. 1358 0.1383 0.1408 0.1434 |0. 1459 |0. 1484 
—B |0.56 0.1510 0.1535 0.1560 0.1586 (0.1611 0.1637 0.1662 0.1687 (0.1713 |0. 1738 
_9 |0.57 (0.1764 [0.1789 0.1815 0.1840 [0.1866 0.1891 |0. 1917 (0.1942 [0.1968 |0. 1993 
_10 |0.58 (0. 2019 |0. 2045 0.2070 0.2096 [0.2121 0.2147 (0.2173 0.2198 (0.2224 |0. 2250 
—11 |0.59 (0. 2275 |0. 2301 0. 2327 0.2353 |0. 2378 0.2404 0.2430 0.2456 |0. 2482 |0. 2508 
12 |0.60 0.2533 0.2559 0.2585 0.2611 |0. 2637 0.2663 0.2689 0. 2715 |0. 2741 |0. 2767 

13 (0.61 0.2793 (0.2819 0.2845 0.2871 [0.2898 0.2924 |0. 2950 0.2976 (0.3002 [0.3029 











_14 |o. 62 |o. 3055 |0. 3081 10. 3107 |0. 3134 |0.3160 ‘0.3186 0. 3213 |0. 3239 (0. 3266 |0. 3292 
_15 |0.63 |0.3319 |0. 3345 |0. 3372 |0. 3398 0. 3425 0.3451 |0. 3478 |0. 3505 ‘0.3531 ‘0.3558 
16 |0. 64 |0. 3585 |0. 3611 0. 3638 0. 3665 0. 3692 0. 3719 |0. 3745 |0. 3772 0. 3799 |0.3826 
_17 |0. 65 |0. 3853 |0.3880 0.3907 10. 3934 0. 3961 0.3989 0.4016 0.4043 |0. 4070 0. 4097 
_18 |0. 66 |0.4125 |0. 4152 0.4179 0.4207 0.4234 0.4261 0.4289 0. 4316 |0. 4344 0. 4372 
_19 |0.67 |0.4399 |0. 4427 0.4454 0.4482 0.4510 0.4538 0.4565 0.4593 (0. 4621 0. 4649 
_20 |0. 68 |0.4677 |0.4705 0.4733 |0. 4761 0. 4789 0.4817 0.4845 0.4874 “0. 4902 0. 4930 
—21 |0. 69 |0.4959 |0.4987 0. 5015 |0. 5044 0.5072 0.5101 0.5129 0.5158 (0. 5187 0. 5215 
_22 |0. 70 |0.5244 |0. 5273 |0. 5302 (0.5330 0.5359 0.5388 0.5417 ‘0.5446 0.5476 0.5505 
_23 |0.71 |0.5534 |0. 5563 0.5592 0.5622 0.5651 0.5681 0.5710 0.5740 0.5769 0.5799 
_24 |0. 72 l0. 5828 |0. 5858 0. 5888 0.5918 0.5948 0.5978 0.6008 0. 6038 0. 6068 0. 6098 
_25 |0.73 0.6128 0.6158 0.6189 (0. 6219 0.6250 0. 6280 0.6311 |0. 6341 (0. 6372 0. 6403 
26 |0. 74 |0. 6433 |0. 6464 0.6495 0. 6526 0.6557 0.6588 0.6620 0.6651 0.6682 0.6713 
_27 |0.75 |0. 6745 |0. 6776 0.6808 0.6840 0.6871 0.6903 0.6935 0.6967 |0. 6999 0.7031 
_28 |o. 76 |0. 7063 |0. 7095 0.7128 (0.7160 0.7192 0.7225 0. 7257 |0. 7290 |0. 7323 0. 7356 
29 |o. 77 |0. 7388 (0.7421 |0. 7454 0.7488 0.7521 0.7554 0.7588 07621 0.7655 (0. 7688 
0.78 |0. 7722 (0.7756 0.7790 0.7824 0.7858 0.7892 0.7926/0:7961 0.7995 0.8030 
[0.79 |0. 8064 (0.8099 0.8134 0.8169 0.8204 0.8239 0.8274 0^8310 0.8345 0.8381 
0.80 0.8416 |0. 8452 0.8488 0.8524 0.8560 0.8596 0.B6383. 0. 8669 0.8705 0.8742 
0.81 0.8779 |0. 8816 |0. 8853 0.8890 (0. 8927 (0. 896550. 3002 0. 9040 (0. 9078 0. 9116 
0.82 0.9154 (0.9192 [0.9230 0.9269 (0. 9307 0,9346-0.9385 0. 9424 |0, 9463 0. 9502 
0.83 (0.9542 |0. 9581 |0. 9621 0.9661 (0. 9701 {0;39741\0. 9782 0. 9822 (0. 9863 0. 9904 
0. 84 (0. 9945 0.9986 1.0027 1.0069 |1. 0110430152 |1. 0194 1. 0237 |1. 0279 1. 0322 
0.85 1.0364 |1. 0407 1.0450 1.0494 1;0587 1.0581 1.0625 1.0669 |1. 0714 1.0758 
0. 86 1.0803 |1. 0848 |1. 0893 1.0939.1.0985 |1. 1031 1.1077 (1.1123 (1.1170 1.1217 
0.87 1.1264 1.1311 |1.1359 |1. 107 jz1455 1.1503 1.1552 1.1601 1,1650 |1. 1700 
0.88 1.1750 1.1800 |1. 1850 1901 (1.1952 |1. 2004 152055 1.2107 |1. 2160 1,2212 
0.89 |1. 2265 (1.2319 132372. 12426 |1. 2481 |1. 25361:2594 |1. 2646 |1, 2702 _1. 2759 
0.90 (1.2816 |1. 2873 41:230 1.2988 1.3047 (1.3106, 128165 |1. 3225 1.3285 1. 3346 
0.91 (1.3408 |1. 3469 |1: 3532 1.3595 |1. 3658 1337221. 3787 |1. 3852 |1. 3917 1. 3984 
0.92 1.4051 41.411811. 4187 1.4255 1.4325 1.4395 1.4466 1.4538 |1. 4611 1. 4684 
0.93 1.4758 1. 4833 1.4909 1.4985 15063 T.5141 1.5220 1.5301 1.5382 1.5464 
0.94 1.5548/1.5632 1.5718 |1. 58055/145893 1.5982 1.6072 1.6164 1.6258 1,6352 
0. 9514, 6449 1.6546 1.6646 1.6747 1.6849 1.6954 1.7060 1.7169 1.7279 1,7392 
0.96 1.7507 1.7624 1.7744 1.7866 1.7991 1.8119 1.8250 1.8384 |1. 8522 1. 8663 
0.97 1.8808 1.8957 1.9110 1.9268 1.9431 1.9600 1.9774 1.9954 2.0141 ‘2,0335 
0.98 2.0537 2.0749 2.0969 2.1201 2.1444 2.1701 2.1973 2.2262 2.2571 2, 2904 
0.99 2.3263 |2. 3656 |2.4089 2.4573 2.5121 |2.5758 2.6521 2.7478 |2,8782 3,0902 








附 表 3 分 布 临界 值 表 
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O la 


利用 Excel 提供 的 统计 函数 “TINV” 可 以 生成 :分布 的 临界 值 表 ，, 该 表 是 根据 :分布 的 
右 尾 概率 a 计算 的 相应 的 临界 值 。 如 果 P(t 三 x) = ， 则 对 于 任意 给 定 的 概率 p(0< a>, 


Th 





可 以 求 出 相应 的 x。 



































生成 + 分 布 临界 值 表 的 具体 操作 步骤 如 下 。 














第 一 步 : ETHER A 列 中 输入 1 分 布 自由 度 df 的 值 ， 在 第 1 行 中 输入 右 尾 概率 a 的 取 
值 ， 构 建 出 t 分 布 临界 值 表 的 表 头 ， 如 下 图 所 示 : 
all 
_1 |df/o0. 250 0.200 |0.150 0.100 |0.050 0.025 |0.010 0.005 |0.001 |0. 0005 
| 
— | 2 
| 3 
msnm 4 
Eu 5 
mam 6 
EEN 7 
m 
县 9 
ll | 10 
ey 11 
13| 12 
| 13 
| 14 
_16 | 15 | à 
第 二 步 : 在 B2 单元 格 输入 公式 “=TINV(BS$1*2，S$A2)”， 并 将 其 向 下 、 向 右 复制 即 可 





得 到 1 分布 的 临界 值 表 , 读者 可 根据 需要 生成 不 同 a 和 不 同 自由 
将 按照 上 述 步 又 操作 得 到 的 部 分 结果 展示 如 下 : A 


A | E e\o Bm r 





度 的 1 分 布 的 临界 值 表 , 现 








vs T E 
— 1 _df/m 0.250 0.200 /| 0.150 | 0.100 | 0.950 0.925 | 0.010 | 0.005 | 0.001 ， 0.0005 
—2 1 (1.000044483764 1.9626 3.0777 6y2138712:7062 31.8205 (63.6567 |318. 3088 636. 6192 
3 | 2 dosies 1:0607 1.3862 1.8856 2.9209 4.3027 6.9646 9.9248 | 22.3271 31.5991 
a| 3 [O.7649' 0.9785 |1. 2498 1.6377 2.5534 | 3.1824 | 4.5407 5.8409 | 10.2145 12, 9240 
5| 4 [007 0.9410 |1.1896 1.5332 2.1318 | 2.7764 3.7469 4.6041 | 7.1732 8.6103 
6 | 5 (0.7267 0.9195 |1.1558 1.4759 2.0150 | 2.5706 | 3.3649 4.0321 | 5.8934 6.8688 
z | 6 (0.7176 0.9057 |1.1342 1.4398 1.9432 | 2.4469 | 3.1427 | 3.7074 | 5.2076 5.9588 
-| 7 [0.7111 0.8960 1.1192 1.4149 1.8946 | 2.3646 2.9980 3.4995 | 4.7853 5.4079 
—9 | 8 (0.7064 0.8889 1.1081 1.3968 1.8595 | 2.3060 2.8965 3.3554 | 4.5008 5.0413 
10| 9 (0.7027 0.8834 |1. 0997 1.3830 1.8331 | 2.2622 | 2.8214 3.2498 | 4.2968  &. 7809 
“i1 | 10 [0.6998 0.8791 |1.0931 1.3722 1.8125 | 2.2281 | 2.7638 3.1693 | 4.1437 4.5869 
12| 11 |0.6974 |0. 8755 |1. 0877 |1. 3634 |1. 7959 | 2. 2010 | 2. 7181 | 3. 1058 4. 0247 4. 4370 
13| 12 [0.6955 0.8726 |1. 0832 1.3562 1.7823 | 2.1788 | 2.6810 3.0545 | 3.9296 — 4.317B 
14| 13 [0.6938 0.8702 1.0795 1.3502 1.7709 | 2.1604 2.6503 3.0123 | 3.8520 4. 2208 
15| 14 [0.6924 0.8681 |1. 0763 1.3450 1.7613 | 2.1448 2.6245 | 2.9768 3. 7874 4.1405 
16| 15 (0.6912 0.8662 |1. 0735 1.3406 1.7531 2.1314 2.6025 2.9467 3.7328  &. 0728 
17| 16 [0.6901 0.8647 |1.0711 1.3368 1.7459 | 2.1199 | 2.5835 2.9208 | 3.6862 4.0150 
18| 17 [0.6892 0.8633 |1. 0690 1.3334 1.7396 | 2.1098 | 2.5669 2.8982 3. 6458 3. 9651 
19| 18 (0.6884 0.8620 |1. 0672 1.3304 1.7341 2.1009 2.5524 2.8784 3.6105 3.9216 
-20| 19 [0.6876 0.8610 1.0655 1.3277 1.7291 | 2.0930 2.5395 2.8609 | 3.5794 3.8834 
_21 | 20 (0.6870 0.8600 |1. 0640 1.3253 1.7247 | 2.0860 _ 2.5280 2.8453 3. 5518 3. 8495 
22| 21 (0.6864 0.8591 |1. 0627 1.3232 1.7207 2.0796 2.5176 2.8314 3.5272 3.8193 
-23| 22 0.6858 0.8583 |1. 0614 1.3212 1.7171 | 2.0739 2.5083 2.8188 | 3.5050 3.7921 
24| 23 |0.6853 0.8575 |1. 0603 1.3195 1.7139 | 2.0687 _ 2.4999 | 2. 8073 3. 4850 3. T676 






























































25 | 24 |0.6848 0.8569 |1. 0593 1. 3178 1.7109 | 2.0639 2.4922 2.7969 3. 4668 3.7454 

26| 25 |0.6844 0. 8562 |1.0584 1.3163 1.7081 | 2.0595 2.4851 2.7874 3. 4502 3. 7251 

27| 26 [0.6840 0.8557 1.0575 1.3150 1.7056 | 2.0555 2.4786 2.7787 | 3.4350 3.7066 

27 [0.6837 0.8551 |1. 0567 1.3137 1.7033 | 2. 0518 | 2. 4727 | 2.7707 3. 4210 3. 6896 

28 |0. 6834 0.8546 1.0560 1.3125 1.7011 | 2.0484 | 2.4671 | 2.7633 3. 4082 3. 6739 

29 0.6830 0.8542 |1. 0553 1.3114 1.6991 | 2.0452 2.4620 | 2.7564 | 3.3962 3.6594 

30 (0.6828 0.8538 (1. 0547 1.3104 1.6973 | 2.0423 2.4573 2.7500 3. 3852 3. 6460 

31 0.6825 0.8534 1.0541 1.3095 1.6955 2.0395 | 2. 4528 | 2. 7440 3. 3749 3. 6335 

32 0.6822 0.8530 1.0535 1.3086 1.6939 2.0369 | 2.4487 | 2.7385 3.3653 3.6218 

33 0.6820 0.8526 1.0530 1.3077 1.6924 2.0345 | 2. 4448 | 2. 7333 3. 3563 3. 6109 

34 0.6818 0.8523 1.0525 1.3070 1.6909 | 2.0322 | 2.4411 | 2.7284 3.3479 3.6007 

35 0.6816 0.8520 1.0520 1.3062 1.6896 ， 2.0301 | 2.4377 | 2.7238 3. 3400 3. 5911 

36 0.6814 0.8517 1.0516 1.3055 1.6883 | 2.0281 | 2.4345 | 2.7195 3.3326 3.5821 

37 0.6812 0.8514 1.0512 1.3049 1.6871 2.0262 | 2. 4314 | 2. 7154 3. 3256 3. 5737 

38 0.6810 0.8512 1.0508 1.3042 1.6860 2.0244 | 2.4286 | 2.7116 3.3190 3.5657 

39 0.6808 0.8509 1.0504 1.3036 1.6849 2.0227 | 2. 4258 | 2.7079 3. 3128 3. 5581 

40 0.6807 0.8507 1.0500 1.3031 1.6839 2.0211 | 2.4233, 2. Yod5S 3.3069 3.5510 

41 0.6805 0.8505 1.0497 1.3025 1.6829 _ 2.0195 | 2. 4208|22. 7012 3. 3013 3. 5442 

42 0.6804 0.8503 1.0494 1.3020 1.6820 | 2.0181 | 2. 4385 % 6981 3. 2960 3. 5377 

43 0.6802 0.8501 1.0491 1.3016 1.6811 2.0167 | 2%4163 | 2.6951 3. 2909 3. 5316 

44 0.6801 0.8499 1.0488 1.3011 1.6802 2.0154 2.4141 | 2. 6923 3. 2861 3. 5258 

45 0.6800 0.8497 1.0485 1.3006 1.6794 2.0141 |`2. £121 | 2.6896 3. 2815 3. 5203 

46 0.6799 0.8495 1.0483 1.3002 1.6787 | 2% D2% | 2°4102 | 2.6870 3. 2771 3. 5150 

47 0.6797 0.8493 1.0480 1.2998 1.6779 2%06137 | 2. 4083 | 2. 6846 3. 2729 3. 5099 

48 0.6796 0.8492 1.0478 1.2994 1.6772% 2.0106 | 2.4066 | 2. 6822 3. 2689 3. 5051 

49 0.6795 0.8490 1.0475 1.2991 k.6766 ‘2:0096 | 2.4049 | 2. 6800 3. 2651 3. 5004 

O 
PYÈ MSL m))= a 
xan) 

a 0.995 0.99 0.95 0.90 0.75 
1 0.000 0.000 0.004 0.016 0.102 
2 0.010 0.020 0.103 0.211 0.575 
3 0.072 0.115 0.352 0.584 1.213 
4 0.207 0.297 0.711 1.064 1.923 
5 0.412 0.554 1.145 1.610 2.675 
6 0.676 0.872 1.635 2.204 3.455 
7 0.989 1.239 2.167 2.833 4.255 
8 1.344 1.647 3.490 5.071 
9 1.735 2.088 325 4.168 5.899 
10 2.156 2.558 3.940 4.865 6.737 
u 2.603 3.053 4.575 5.578 7.584 
12 3.074 3.571 5.226 6.304 8.438 
13 3.565 4.107 5.892 7.041 9.299 
14 4.075 4.660 6.571 7.790 10.165 
15 4.601 5:229 7.261 8.547 11.037 



































































































































a 0.995 0.99 0.95 0.90 0.75 
16 5.142 5.812 7.962 9312 11.912 
17 5.697 6.408 8.672 10.085 12.792 
18 6.265 7.015 9.390 10.865 13.675 
19 6.844 7.633 10.117 11.651 14.562 
20 7.434 8.260 10.851 12.443 15.452 
21 8.034 8.897 11.591 13.240 16.344 
22 8.643 9.542 12338 14.041 17.240 
23 9.260 10.196 13.091 14.848 18.137 
24 9.886 10.856 13.848 15.659 19.037 
25 10.520 11.524 14.611 16473 19.939 
26 11.160 12.198 15.379 17.292 20.843 
27 11.808 12.878 164151 18.114 21.749 
28 12.461 13.565 16.928 18.939 22.657 
29 13.121 14.256 17708 19.768 23.567 
30 13.787 14.953 18.493 20.599 24.478 
31 14.458 15.655 19.281 21.434 
32 15.134 16.362 À 20.072 22271 
33 15.815 17.073 
34 16.501 17.789 21.664 23.952 
35 17.192 18:500 25.465 24.797 
36 17.887 19.233 23269 25.643 
37 18.586 19.960 54.075 26.492 
38 19.289 20.691 24.884 27.343 

39 | 195996 21.426 25.695 28.196 
40 | 202707 22.164 26.509 29.051 
41 21.421 22.906 27.326 29.907 
42 | 22.138 23.650 28.144 30.765 
43 22 860 24398 28.965 31625 
44 | 23.584 25.148 29.787 32.487 
45 24311 25.901 30.612 33.350 
a 0.25 0.1 0.025 0.01 
1 1.323 2.706 5.024 6.635 
2 2.773 4.605 7378 9.210 
3 4.108 6251 9.348 11.345 
4 5.385 7.119 11.143 13.277 
5 6.626 9.236 12.832 15.086 
6 7.841 10.645 14.449 16.812 
7 9.037 12.017 16.013 18.475 








ana (Q 天 853 0T 

























































































续 表 
a 0.25 0.1 0.05 0.025 0.01 0.005 
8 10219 13.362 15.507 17.535 20.090 21.955 
9 11.389 14.684 16.919 19.023 21.666 23.589 
10 12.549 15.987 18307 20.483 23.209 25.188 
ll 13.701 17.275 19.675 21.920 24.725 26.757 
12 14.845 18.549 21.026 23.337 26.217 28.300 
13 15.984 19.812 22.362 24.36 27.688 29.819 
14 17.117 21.064 23.685 26.119 29.141 31.319 
15 18.245 22.307 24.996 27.488 30.578 32.801 
16 19.369 23.542 26.296 28.845 32.000 34.267 
17 | 20489 24.769 27.587 30.191 33.409 35.718 
18 | 21.605 25.989 28.869 31.526 34.805 37.156 
19 | 22718 27204 30.144 325852 36.191 38.582 
20 | 23.828 28.412 31.410 34.170. 37.566 39.997 
21 24.935 29.615 33479 38.932 41.401 
2 26.039 30.813 36.781 40.289 42.796 
23 27.141 32.007 41.638 44.181 
24 28.241 33.196 39.364 42.980 45.558 
25 29.339 44.314 46.928 
26 | 30.435 35.563 41.923 45.642 48.290 
27 | 31.528 36741 45105 46.963 49.645 
28 32.620 37916 444461 48.278 50.994 
29 | 33711 39.087 45.722 49.588 52.335 
30 | 34.860 40.256 46.979 50.892 53.672 
31 35:887. 41.422 48.232 52.191 55.002 
32 36973 42.585 49.480 53.486 56.328 
33 38.058 43.145 50.725 54.775 57.648 
34 | 39141 44.903 51.966 56.061 58.964 
35 | 40.223 46.059 53.203 57.342 60.275 
36 | 41304 47.212 54.437 58.619 61.581 
37 | 42383 48.363 55.668 59.893 62.883 
38 | 43462 49.513 56.895 61.162 64.181 
39 | 44.539 50.660 58.120 62.428 65.475 
40 | 45616 51.805 59.342 63.691 66.166 
41 46.692 52.949 60.561 64.950 68.053 
42 | 47.766 54.090 61.777 66.206 69.336 
43 | 48.840 55.230 62.990 67.459 70.616 
44 | 49913 56.369 64.201 68.710 71.892 
45 50.985 57.505 65.410 69.957 73.166 

















附录 用 Excel 生成 概率 分 布 表 ,rss 


附 表 5 三 分 布 临 界 值 表 


o F, FP s 




















利用 Excel HEHEHE Th R “FINV” TAER F ii Ere F sti 
的 右 尾 概率 a 计算 的 相应 的 临界 值 ， 即 如 果 P(E > EK 于 任意 给 定 的 概率 
(0 三 a 夺 1)， 可 以 求 出 相应 的 x。 可 按照 如 下 操作 步 又 成 PANE HER. 

第 一 步 : 将 下 分布 右 尾 概率 a 的 取 值 (如 a =0.05 输入 到 BI 单元 格 中 ， 将 分 子 自 
HJ dfl 的 值 输入 到 第 2 行 中 ， le 入 在 第 1 列 中 ， 如 下 图 所 示 : 


p~ 





























a | E | c W KY) ec a | r | r | x | 
1 | == 0.05 WY 
2 PT 2 | SNN 5 |6 Lr |a |o [o 
am 1 LS > 党 
|: mp: HN x Al 
[a] 3 | 2 XL 
[el 4 分- 
加 5 - I! 
8 6 < A> 
9| <N. Am 
ol rS | 
|: 9 
12 | 10 | | 











第 二 步 : 在 B3 单元 格 输入 公式 “=FINV($B$1,B$2,$A3)”， 并 将 其 向 下 、 向 右 复制 即 
可 得 到 五 分 布 的 临界 值 表 ， 可 根据 需要 生成 不 同 a 和 不 同 自由 度 的 瑟 分 布 的 临界 值 表 ， 现 
以 a = 0.05 为 例 将 下 分 布 临界 值 表 的 部 分 结果 展示 如 下 : 








Nk) 









































B Ë D E F í I n i Ï K 
BE = 0.05 
2 za 1 2 3 4 5 6 8 9 10 
3 1 161.448 199.500 215.707 224.583 230.162 233.986 236.768 238.883 240.543 241.882 
4| 2 18.513 19.000 19.164 19.247 19.296 19.330 19.353 19.371 | 19.385 19.396 
5| 3 10.128 9.552 9277 9.117 9.013 8.941 | 8.887 8.845 | 8.812 | 8.786 
6 4 7.709 6944 6591 6.388 6.256 6163 6094 6041 5999 5.964 
Ea 5 6.608 5.786 — 5.409 5.192. 5.050 4950 4876. 4818 4772 47135 
—_ B| 6 5.987 — 5.143 | 4.757 — 4.534 — 4.387 4.284 4.207 | 4.147 | 4.099 — 4.060 
D 7 5.591 4.737 4.347 4.120 3.972 3.866， 3.787 3.726 | 3.677 3.637 
10| 8 5.318 4459 4.066 3.838 3.687 3.581 3.500 3.438 3.388 3.347 
u| 9 5.117 4.256 — 3.863 3.633 3.482 3.374 3.293 3,230 3.179 3.137 
12| 10 | 4.965 4103| 3.708 3.478. 3.326 | 3.217 3135 | 3.072 | 3.020 2.978 
13| 11 | 4.844 3.982 3.587 — 3.357 3.204 3.095 — 3.012 | 2,948 2.896 | 2.854 
14| 12 4747| 3.885 3.490 3.259 3.106 2.996 2.913 |, 27849 2.796 2.753 
15| 13 | 4667| 3.806 — 3.411 — 3.179 3.025 2915| 2.832 T2787 — 2.714 | 2.671 
16| 14 | 4.600 3.739 3.344 3.112 2.958 2.848 2764 269 2.646 | 2.602 
17| 15 | 4.543 | 3.682 | 3.287 — 3.056 2.901 2.790 Z of, 264 | 2.588 2.544 
18| 16 | 4494 3.634 | 3,239 — 3.007 2,852 2.7414 %657 ` 2,591 | 2.538 2.494 
19| 17 4.451 3.592 3.197 2.965 2.810 2.699 \ 2.Bl4 2.548 2.494 | 2.450 
20| 18 | 4.414 | 3,555 | 3.160 | 2.928 | 2.773 /2.6Bt- 2.510 | 2.456 | 2.412 
21| 19 | 4.381 3522 3.127 2895 | 2.740, 《62BN 2.477 2.423 2.378 
22| 20 | 4351| 3.493 308 286 “2711 2 599 2.447 2.393 | 2.348 
RES] 21 | 4325| 3.467 | 3.072 | 2.840 | 25685 X Z. 2.420 2.366 | 2.321 
24| 22 | 4301| 3.443 309 287 “9661. 2.549 2.397 2.342 2.297 
225 23 | 4279 3.422 30B 2,7964 240 “2. 2.375 2.320 | 2.275 
26| 24 | 4.260 | 3.403 | 3.009 2776-2621 “2. 2.355 2.300 2.255 
27| 25 | 4.242 3.385 2.991, + 2.759. 2.603 2 2.337 | 2.282 | 2.236 
28| 26 4. 225 3.369 2.975 X 2. 587 2. 321 2.265 2. 220 
Esi 27 4.210 3.354 _ 2.960. 2.572 2. 305 2.250 2. 204 
30| 28 4.196 3.340 » 20947 1 2.558 t 2. 291 2. 236 2.190 
31| 29 | 4183 3,328 ' 2.934 2.545 | Xá, 1 2.278 | 2.223 | 2.177 
32) 30 | 4171 | 3 8f6 | 2.922 2.584 上 22421 | 2.334 | 2.266 | 2.211 | 2.165 
33 31 4.160 上 3.305 2.911 2.523 2.409 | 2.323 | 2.255 | 2.199 | 2.153 
3 32 由 » 3.,295 | 2.901 2.512 2.399 | 2.313 | 2.244 | 2.189 | 2.142 
35| 33 _ 4 V3.285 | 2.892 Z503 | 2.389 | 2.303 | 2.235 | 2.179| 2.133 
36 34 ` S 3.276 2.883 2.494 | 2.380 2.294 | 2.225 2.170 | 2.123 
arl 35 1N 3.267 2.874 2.485 | 2.372 2.285 | 2.217 2.161 | 2.114 
38| 36 3.259 2.866 2.477 | 2.364 | 2.277 | 2.209 — 2.153 | 2.106 
a 37 3.22 | 2859 2.470 | 2.356 | 2.270 | 2.201 2.145 2. 098 
40 38 3.245 2.852 2.463 | 2.349 | 2.262 | 2.194 2.138 2. 091 
44 39 3.238 2.845 2.456 | 2.342 2.255 | 2.187 2.131 2. 084 
42| 40 3.232 | 2.839 2.449 | 2.336 2.249 | 2.180 2.124 2. 077 
43 41 3.226 _ 2.833 2.443 2.330 — 2.243 | 2.174 2.118 | 2.071 
a4] 42 3.220 2.827 2.438 | 2.324 | 2.237 | 2.168 | 2.112 | 2.065 
45| 43 3.214 | 2.822 2.432 | 2.318 — 2.232 | 2.163 | 2.106 | 2.059 
46 | 44 3.209 2.816 2.427 | 2.313 | 2.226 | 2.157 | 2.101 | 2.054 
aT] 45 3.204 | 2.812 2.422 | 2.308 | 2.221 | 2.152 | 2.096 | 2.049 
48| 46 3.200 2.807 2.417 | 2.304 2.216 | 2.147 | 2.091 | 2.044 
49] 47 3.195 2.802 2.413 | 2.299 ， 2.212 | 2.143 | 2.086 | 2.039 
50| 48 3.191 2.798 2.409 | 2.295 2.207 | 2.138 2.082| 2.035 
SL | 49 3.187 2.794 2.404 | 2.290 2.203 | 2.134 2.077 | 2.030 
52| 50 3.183 | 2.790 2.400 | 2.286 | 2.199 | 2.130 2.073 | 2.026 





T 











习题 答案 


第 1 章 总 论 
f; 
(D 数值 数据 O 数值 数据 。 (3) 数值 数据 。 “(4) 分 类 数据 — (5) 分 类 数据 
O 分 类 数据 D 顺序 数 
2: 
(1) 总 体 是 IT 从 业者 :样本 是 200IT 从 业者 ; 样本 容量 为 200。 
O 数值 数据 : 分 类 数据 。 ,AO 
3， 推 断 统 计 ，(1) 和 (3)， 描 述 性 统计 : (2)。 ; 
4. 参数 : 32%; 统计 量 35%。 A 


第 2 章 “统计 数据 的 收集 与 处 至 





m 





一 、 填 空 题 

. 直接 来 源 ， 间 接 来 源 

. 间接 来 源 数据 

. 普查 ， 抽 样 调查 
、 时 效 性 较 高 、 适 用 面 C 
非 概率 抽样 了 了- S tx 








第 3 章 统计 数据 的 整理 与 图 形 展示 
一 、 填 空 题 
1. 分 类 数据 ， 顺 序数 据 — 2. 频数 分 布 表 3. 频数 4. 频数 分 布 表 5. 条 形 图 
6. 帕 累 托 图 7. EHR 8. 22: 叶 ”9. 分 组 ; 未 分 组 10. 箱 线 图 11. 组 距 分 组 
12. 等 距 分 组 ， 不 等 距 分 组 13. 下限， 上限 14. 组 距 15. 不 重 不 漏 。 ”16. 直方 图 
17. 时 间 序 列 数据 18. 二 维 散 点 图 19. Rk: 行 标题 ， 列 标题 ， 数 字 资 料 
20. 表 号 ; 总 标题 ， 表 中 数据 的 单位 
二 、 单 项 选择 题 


aH HH 




















1. 
(1) 顺序 数据 。 (2) (3) 略 
2 一 5 略 


grs (Q megaa TTT 


第 4 章 统计 数据 的 指标 度量 









































一 、 填 空 题 
1. 3 2. 中 位 数 3. 四 分 位 差 4. 对 称 分 布 5. 0.4 
6， 偏 态 系数 7. 0.5 8.0 9. 正 值 

二 、 单 项 选择 题 
序号 | í | 2 3 4 5 & | > | ë 
答案 č B A B B A B 
序号 9 10 11 12 13 14 15 
sz | B | p A D B e A-| 

三 、 多 项 选择 题 
序号 1 学 3 4 5 6 7 8 
答案 | ABC AB 


四 、 名 词 解释 ( 略 ) 
五 、 计 算 题 

1. 

首先 将 25 个 数据 进行 排序 ， 排 序 结果 如 EY 60..60. 62. 63. 64. 64. 66. 67. 68. 68. 69. 70. 
73、 74, 76、 78、 81. 81. 81、 81、 81.\86%87, 89. 90 

(1) 众 数 为 81 

(2) 中 位 数 ，73 7 

下 四 分 位 数 : 64+0.25*(66*64)=64.5; 上 四 分 位 数 :81 

平均 数 : 73.56 





(4) 将 这 组 数据 输入 到 Excel H, WA: 

众 数 的 Bxsel 的 计算 过 程 MODE (60,60,…,90) 

中 位 数 的 Excel 的 计算 过 程 MEDIAN(60,60,…，90) 
上 





下 四 分 位 数 的 Excel 的 计算 过 程 QUARTILE(array quart)， 其 中 array 为 (60,60,…，90)，quart 为 1 
-四 分 位 数 的 Excel 的 计算 过 程 QUARTILE(array quart)， 其 中 array 为 (60,60…，90)，quart 为 3 
平均 数 的 Excel 的 计算 过 程 AVERAGE(60,60,…，90) 

方差 的 Excel 的 计算 过 程 VAR(60,60,…，90) 








= 





2. 
统计 学 成 绩 理想 。( 提 示 : 计算 两 门 成 绩 的 标准 分 数 ) 
3: 





(1) 女童 身高 差异 大 。 原 因 女 童 身高 数据 的 离散 系数 大 于 男 童 身高 数据 的 离散 系数 。 
D 同 (1) 答 案 。 原因 : 离散 系数 这 个 衡量 指标 本 身 就 已 消除 了 因 计 量 单位 不 同 或 平均 水 平 高 低 不 等 的 
影响 











=1 633.33 








JAER 





È SM, -7) 
总 = 各 
n—l 
_ (750 —1 633)? x19 + (1 250 — 1 633)° x30+(1750—1633) x42+(2250—1633) x18+(2750—1633) x11 
120-1 
=339 125.8 
5. 


采用 “离散 系数 ”指标 比较 两 种 组 装 方法 的 离散 程度 

方法 1 的 平均 数 为 166， 标 准 差 为 3.4614， 则 离散 系数 为 47.96; 方法 2 的 平均 数 为 128， 标 准 差 为 
1.912， 则 离散 系数 为 66.999 6， 所 以 会 选择 方法 进行 组 装 ， 原 因 是 平均 值 比方 法 2 的 平均 数 大 ， 且 离散 系 
数 比 方法 2 的 离散 系数 小 ， 表 明 单位 时 间 组 装 产 品 个 数 波动 程度 小 。 

















第 5 章 参数 估计 << 
2. 正 态 分 布 3. 比例 ”> 全 计量 5. 估计 什 





7. 区 间 估 计 8. 置信 区 加 WE FR, 置信 上 限 
10. 无 偏 性 ， 有 效 性 ，- 11. 一 致 性 12. 正 态 分 布 
14. 点 估计 值 ， 边 隔 





(1) 81 (2) 1.2 (3) 2.352 (4) 78.648 一 83.352 


根据 : X—N(u,L ot) ti X, —N00,500) ， X,,—N(0.200) 
n 


4 

(1) 0.5 (2) 0.05 

5. 

(1) 样本 比例 的 标准 差 公式 为 aa, 所 以 分 别 为 0.04，0.0179，0.0126 


(2) 随 着 样本 容量 的 增 大 ， 样 本 比例 的 标准 差 越 来 越 小 
6. 提示 x+Z ss/ 
7. 提示 ts(n 一 Ds/Vn 








8. ERY +Z, sÍ n 
£ p(l- p) 









10. 提示 (n-1)s° sgg (n— l) 
Z n (n—1) Z nB (n_1) 


ii 提示 /> Cl 





12. g n > Caiza) 


第 6 章 假设 检验 





二 、 简 答题 wo 


L RN 


(1) 提出 原 假设 H, MERGE H, 。 NX 
(2) 构造 检验 的 统计 量 ， 并 计算 其 





(3) 根据 给 出 的 显 





i 性 水 平 q y RX amem eaat Oo 
(4) 统计 决策 。 ,Yk x KA 

2. x x 

ERREEN E sakha MEE BIS TINK a REE P h RRR 
TB. HAN: 大 作息 两 类 PRAIRIE AE TIE RIE REMITA 误 发 生 概率 同时 减 小 。 


3 N fà 
2 要 
当 总 体 方差 已 知 ， 无 论 大 小 样本 ， 假 设 检 验 统计 量 为 Z= 二 入 NOD 
CO/ Jn 


当 总 体 方差 未 知 ， 大 样本 ， 假 设 检验 统计 量 为 Z= 工 -多 PA 


当 总 体 方差 未 知 ， 小 样本 ， 假 设 检验 统计 量 为 1 = i D 


n 





4. 
(1) H,: z=40%; H,: x#40% 


CO) z=- ~N(0,l) 
mi7) 


Hh z= 20) 


40%(1— 40%) 
n 


(3) (—x,-Z,,,)U(Z,,,,+oo) ， 查 表 Zoos = 1.96 ， 所 以 拒绝 域 为 (—o,—1.96)U (1.96,+0) o 
(4) 作出 决策 。 


‘EW 


习题 答案 ,ts 
三 、 判 断 分 析 题 
1: 
错误 ， 正 确 的 过 程 如 下 
(1) 提出 原 假设 和 备 择 假 设 。 





H, : 0° > 0.00156;H,:o?<0.00156 


(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 


p -CDS _ 9x000211 -1339 
o 0.00156 





(3)a =0.05 ， 确 定 拒绝 原 假设 的 区 域 。 有 
从 备 择 假设 中 可 以 看 出 此 处 是 左 侧 检验 ， POEEM [oix O Zoss (99) ERA 











js2(99)= 77.0463 ， 所 以 拒绝 域 为 (0,77.0463) 。 <S 
(4) 统计 决策 。 < 二 
Z =133.9> yoos*(99)=77.0463， 所 以 不 拒绝 原 假设 。 x 
2， 错 误 ， 正 确 的 过 程 为 : SS I 
(1) 提出 原 假设 和 备 择 假设 。 NA 


Hp SHS >10 
D 构造 检验 的 统计 量 ， 并 计算 其 值 。 x< 


SN _11-10_ =Ç 
SHE sdz Ps 
(3) a = 0.05 ， 确 定 拒绝 原 假设 的 区 域 。 X 94 
备 择 假设 中 可 以 看 出 此 处 是 右 侧 检验 ， PE 0AE AGO 0-4]. 其 中 nos(24) 查 表 得 
mu(24)= 2.0639 ， 所 以 拒 (2.063 9,+oo) xX P 
O 统计 决策 《个 ,条 N 
B aa FARAR < 
J 
四 、 计 算 题 》 
=. z E= 
1. 提示 : Z TAR 
s J. e 
2 Z PTS, N(0,1) 
n 
-hh 
3. 2 Te 


4. t=% ~n- 


sjn 
E. Excel 操作 题 ( 略 ) 











NS 


grs (Q megaa TTT 























第 7 章 方差 分 析 
一 、 单 项 选择 题 
řas | 1 | ° â 4 5 6 | 7 | œ 
答案 B B D A Ç A A 
序号 9 10 ll 12 13 14 15 
*= | a | a A B B A | a | 
二 、 简 答题 
1. i% 
Š: 
(1) 每 个 总 体 都 应 服从 正 态 分 布 。 
(2) 方差 齐 性 。 
(3) 观测 值 是 独立 的 。 
(1) 提出 原 假设 ,和 备 择 假设 H, 
Ho: ===: H: M.M. Hk 


(2) 构造 检验 统计 量 ， 并 计算 其 值 。 
p- SSANK-D MSA pepin H 
SSE(n-k) MSE 


(3) R B 00 RAEk Ea 确定 拒绝 原 假设 的 区 域 

(F,(k—l,n—k),+%) 

(4) 统计 决策 。 

4 F> F (kale k) ,拒绝 原 假设 ， 当 下 <P,(k 和 ,加 2k)， 不 拒绝 原 假设 。 

4. 

(1) 提出 原 假设 和 备 择 假 设 Ho: u =: Hí H u, G j) o 

(2) 构造 检验 统计 量 ， 并 计算 其 值 y, -x 。 

(3) 根据 给 出 的 显著 性 水 平 a 的 数值 ， 确 定 拒绝 原 假设 的 区 域 (-o0,-LSD)U (LSD, +0) 。 
(4) 作出 决策 。 








三 、 计 算 题 
1. 
x, =25Lx, =255,x, =252,x, =252,x =253 
SSE=696, SSA=75, F=—B/3 -0.933 9, 临界 值 为 4.636 7 
696126 
4 个 生产 线 的 装填 量 无 显著 性 差异 。 


2 
均值 分 别 为 亏 =35.85, 交 = 31.633 3,7, = 34.44, X = 33.693 33 
SSE=74.975 33 


SSA=46.854 
_  46.854/2 
74.97533 /12 


EETA 


=3.749 553 


JAER JU 


ER F, (2,12) = 6.926608 ， 所 以 不 拒绝 原 假设 ， 即 3 个 路 段 对 行车 时 间 无 显著 性 影响 。 


a) 










F-crit 
1.4716 | 3.354 131 











(2) 3 个 时 间 段 的 行车 时 间 无 显著 性 的 差异 。 





P, Excel 操作 题 ( 略 ) 
第 8 章 相关 与 一 元 回归 分 析 


一 、 单 项 选择 题 





二 、 多 项 选择 题 


Ce [| 1 TSN 5 L + T ，| 
三 、 简 答题 
& Š 
(1) 进行 相关 分 析 。 目 的 是 判断 因 变 量 和 自 变 量 之 间 是 否 具 有 线性 关系 。 
(2) 回归 分 析 S 如 果 第 AANER 之 间 存 在 线性 关系 ， 则 要 进行 变量 的 回归 分 析 。 
(3) 经 济 预测 和 经 济 控制 。 - 步 主要 是 利用 第 二 步 的 回归 分 析 ， 进 行经 济 预测 和 经 济 控制 。 
2. 
(1) 两 变量 的 样本 之 间 是 否 存在 线性 的 关系 ; Hik: 散 点 图 。 
(2) 两 变量 的 样本 之 间 的 关系 强度 如 何 ; 方法 : 相关 系数 。 
(3) 样本 所 反映 的 变量 之 间 的 关系 能 否 代表 总 体 变量 之 间 的 关系 。 方 法 ， 相 关系 数 检验 。 
3 
(1) 根据 最 小 二 乘法 的 定义 可 得 。 
L=YXO,- $) = D0,-h -bry 
(2) 求 minL ， 一 般 情 况 ， 分 别 对 上 式 中 的 未 知 数 求 一 阶 偏 导 ， 令 其 式 子 为 0。 
ôL 


go —2x(y, -Pb -px)=0 


F 2x(y;,- Â- Bx)s, =0 












6) . 5 
Ê= 7-7 


ANCHO 


统计 学 ®© 理论 5 实务 


PEDJA 

Do 
4. 
1) 线性 关系 检验 过 程 
(1) 提出 原 假设 有 ,和 备 择 假设 H, 。 
Hp =0 ”线性 关系 不 显著 
本 :Bz#0 线性 关系 显著 
(2) 构造 检验 的 统计 量 ， 并 计算 其 值 。 

RA 
SSE/(n—2) 入 

(3) 根据 给 出 的 显著 性 水 平 a ， 确 定 拒绝 原 假设 的 区 域 。 EE K 


(F,(l,n—2),+%) Ë SS 
@ 统计 决策 。 
"4 F > F,(,n—2) 时， Was” i 两 变量 的 线性 关系 显著 。 
2) 回归 系数 的 检验 
(1) 回归 系数 y 的 检验 。 


° Bu S :pz0。 


H,:B=0; H.:B 0 x 
@ 构造 检验 的 统计 量 ， (Z Sa x 以 
A 
. “ee X 
À, “d 
x” 





Ai L 
i N > merr 
O 根据 给 出 的 显著 性 水 平 a ， 确 定 拒绝 原 假设 的 区 域 。 

(=0,-ta T (n—2))U(t (n -2),+%) 

@ 统计 决策 。 

12(n 一 2) 时， 检验 统计 量 落 在 拒绝 原 假设 区 域内 ， 所 以 拒绝 原 假设 ， 回 归 系 数 所 显著。 
(2) 回归 系数 A, 的 检验 。 

O 提出 原 假设 ,和 备 择 假设 H, 。 

H;:Añ =0; H:p,#*0 

@ 构造 检验 的 统计 量 ， 并 计算 其 值 。 








1 名 ~- 
Sh 
@ 根据 给 出 的 显著 性 水 平 a ， 确 定 拒绝 原 假设 的 区 域 。 
(oaa-2)U(GeaCz 一 2)+eo) 
@ 统计 决策 。 
当 咱 >i(n 一 2) 时， 检验 统计 量 落 在 拒绝 原 假设 区 域内 ， 所 以 拒绝 原 假设 ， 回 归 系 数 A 显著 。 


EW 





习题 答案 JAU 





四 、 计 算 题 


方差 分 析 表 













平方 和 均 方 F 
回归 | 1 | 1744 705.4 1744705.4 | 194.4141 
53 845.02 8974. 17 == 

1798 550.42 


P F-crit 
8.48119E-06 | 5.987 4 

















参数 估计 表 


rstat 


5050.5 867.783 5 
X Variable 0.658 0.032 93 19.98 


(2) $, =5 050.5 +0.658x, 。 


G) Rè = SSR 17447054 _ 
SST 1798550.42 ` 











O 提出 原 假设 ,和 备 择 假设 He 

H;:A=0 线性 关系 不 显著 

HA0 线性 关系 显著 

@ 构造 检验 的 统计 量 ; 并 计算 其 值 。 
_ —SSR /l 

SSE/(n—-2) 

图 根据 给 出 的 显著 性 水 平 a ， 确 定 拒绝 原 假 设 的 区 域 。 

(F,(l,n < 2),+oo) ft K F, (1.6) = 5.987 4 

@ 统计 决策 。 

m F> F,(1,n-2) 时 , 检验 统计 量 落 在 拒绝 原 假设 区 域内 , 所 以 拒绝 原 假设 , 两 变量 的 线性 关系 显著 。 

(5) 写 出 自 变量 回归 系数 的 检验 步骤 。 

@ 提出 原 假设 0 志 y 夺 1 和 备 择 假设 H,:p=0,H,:p#0。 

H,;:A=0; H,:Añ 0 

@ 构造 检验 的 统计 量 ， 并 计算 其 值 。 








=194.4141~F(l,n—2) 














A =19.98~t(n-2) 

À 

O 根据 给 出 的 显著 性 水 平 a ， 确 定 拒绝 原 假设 的 区 域 。 

(-%,-t, s(n 一 2))U (tjs(n 一 2),+%m) Æ t,əs(6) = 2.968 7 

@ 统计 决策 。 

当 咱 >t,(n 一 2) 时 ， 检 验 统计 量 落 在 拒绝 原 假设 区 域内 ， 所 以 拒绝 原 假设 ， 
(6) 略 。 











E 





归 系 数 户 显著 。 
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学 (第 2 版) 7-301-19351-8 


雷 金 荣 
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源 如 电子 课件 、 电 子 样 章 、 
要 浏览 更 多 专业 教材 ， 请 扫 下 面 凶 
、 浏 览 教材 目录 、 内 容 简介 等 信 





[OP 
们 将 及 时 做 好 全 方位 的 服务 .联系 方式 : 010-62750667, wangxc02@163.com, 





感谢 您 使 用 我 们 的 教材 , 欢迎 您 随时 与 我 们 联 


pup_6@163.com，lihu80@163.com， 欢 迎 来 电 来 信 。 客 户 服务 QQ 号 : 1292552107， 欢 迎 随时 咨询 。 








